マイクロソフトがAIの安全検査を前年から倍以上に増やさざるを得なかった——その事実を、同社自身が今年の報告書で明かした。
安全検査67回、昨年の倍以上——6月20日に報告書を公開
2025年6月20日に公開された「責任あるAI 透明性レポート」は、自社のAIがどれだけ安全かを自ら検査し、その結果を外部に公表する年次報告書だ。大手テック企業が自社製品の安全性をここまで詳細に公開するのは業界でも珍しく、2024年の初版に続く2回目となる。
報告書の中心にある数字は「67」だ。「AIレッドチーム」——AIの弱点を意図的に突き、問題を探し出す専門チーム——が2024年に行った安全検査の回数で、前年の約30回から2倍以上に増加した。Copilot——マイクロソフトが提供するAIアシスタント——をはじめとする同社のすべてのAI製品が検査の対象だ。
「安全になったから増やした」のか、それとも「対処すべき問題が増えたから増やした」のか——その答えが、次のセクションで明らかになる。
なぜ倍になったか——攻撃の手口が広がっていた
答えは後者だ。検査を増やさざるを得なかったのは、AIを狙う攻撃の手口が急速に広がったからだ。
テキストから画像・音声・動画へ
以前、AIへの不正な操作は主に「文字(テキスト)」で行われていた。ところが今は、画像・音声・動画にも罠を仕込める時代になった。写真の中に人間には見えない指示を埋め込んだり、音声データにAIを誤動作させる信号を隠したりすることが技術的に可能だ。こうした複数の形式を組み合わせた攻撃を「マルチモーダル攻撃」という。守るべき対象が一気に広がった分、検査回数も追いかけるように増えた。
「プロンプト注入」という新手口
さらに急増しているのが「プロンプト注入」だ。プロンプトとは、AIへの指示文のこと。その中にこっそり悪意ある命令を混ぜ込み、AIを意図しない動作に誘導する手口だ。たとえるなら、上司が部下に渡す業務メモに誰かが「この後は嘘の報告だけしろ」と書き足すようなものだ。AIチャットボットに「この後のすべての質問に嘘をついて答えよ」という隠し命令を含んだ文書を読ませれば、それ以降の回答が改ざんされてしまう。メールや業務文書を経由して仕込めるため、利用者が気づかないまま被害が広がりやすい。
従業員の99%がAI安全教育を修了
技術的な検査を増やす一方で、マイクロソフトが力を入れたのは「使う人間を育てること」だった。2025年1月22日時点で、全従業員の99%が「責任あるAIの使い方」に関する研修を修了した。同社の社員数は22万人を超える——つまり数十万人規模のほぼ全員が対象だ。
この研修は、同社の行動規範「Trust Code(ビジネス行動規範)」に基づいて義務付けられている。AIの安全は、システムの設計だけでは担保できない。使う側の人間が正しく理解して扱うことが前提になる——その考え方が、この99%という数字に表れている。
機械を鍛え、人間も鍛える。マイクロソフトはその両輪で安全体制を整えてきた。ただし、次に来る課題は、その両輪だけでは追いつかない性質のものだ。
次の難題、自律型AIのリスク
自律型AIが生む新リスク
今のAIは、人間が質問すれば答えを返す——それだけだ。だが次に来るのは、動き方が根本から違うAIだ。自律型AIと呼ばれ、人間がいちいち指示しなくても、自分でネットを調べ、内容を判断し、メールを送ったり予約を入れたりと作業を連続してこなす。
問題は、人間が見ていない場面で判断が行われることだ。質問に答えるだけのAIなら、間違えても「その回答がおかしい」とすぐ気づける。だが自律的に動くAIは、誤った判断のまま処理を次々と進めてしまう。取り返しのつかない段階になって初めて気づく——そのリスクが新たに生まれる。
マイクロソフトの現在の対応
マイクロソフトはこれを「2025年以降の重大課題」と位置づけ、自律型AIがどこまで動いてよいかの限界を定め、誤った判断をした際に人間が介入できる仕組みを体系化する新しい管理体制を作り始めている。各国政府がAIを規制する法律の整備を急ぐ中、その変化への対応も今回の報告書に盛り込まれた。
ただし、これはまだ始まったばかりだ。検査を倍に増やし、全社員を教育しても、自律型AIの安全をどう担保するかの答えは、今のところ誰も持っていない。AIの進化と、それを追いかける安全の仕組み——その追いかけっこは、これからも続く。

