地味な更新、中身は推論力2.5倍　Googleが新AIモデル

2026年4月16日

URLをコピーしました！

30以上の資料から引用を拾い、21ページ分の調査報告書を3分で仕上げる。これが、Googleが2026年2月19日に公開したAI「Gemini 3.1 Pro（ジェミニ・スリー・ポイントワン・プロ）」が示した、最も分かりやすい変化だ。

Geminiは、「ChatGPT（チャットGPT）」を擁するOpenAI（オープンエーアイ）に対抗するGoogleのAIサービスだ。質問への回答、文章の生成、資料の要約など、ビジネスの幅広い場面で使われており、今や世界中の企業が競うように導入を進めている。

「3分で21ページ」が実現した

これまでのAIは、長い文章を一気に書くことが苦手だった。途中で打ち切られたり、何度もやりとりを繰り返さなければ仕上がらなかったりした。今回の更新でその壁が大きく取り払われた。Googleの公式発表によると、一度に生成できる文章量の上限が大幅に引き上げられ、長文レポートの生成・分析が実務の時間軸で現実的な選択肢になった。

「3分で21ページ」という数字は、この恩恵を受けたサービスが示した具体的な実績だ。Googleが提供する「NotebookLM（ノートブックLM）」——分厚い資料や議事録を読み込ませると、要点の整理や対話形式のまとめを自動で作るサービス——が、Gemini 3.1 Proを搭載した。30以上の資料を横断して引用を整理し、21ページの調査報告書を3分で仕上げる。その実例がこの数字だ。調べものや資料整理の手間を、ツールがそのまま肩代わりする形になってきた。

見落としやすいのは、「3.1」というバージョン番号の地味さだ。「3.0から3.1」は、ソフトウェアの世界では小幅な修正を意味する数字に見える。だが中身は、前のバージョンとは別物と言っていいほど変わっている。その落差が、このニュースの核心にある。

推論力が2.5倍に跳ね上がった

「3分で21ページ」という変化の裏には、もっと根本的な能力の飛躍がある。AIが「考える力」そのものを大きく伸ばしたことだ。

ここでいう「推論力」とは、答えをすぐ検索して引っぱってくるのではなく、複数の情報をつなぎ合わせて自分で考え、答えを導き出す能力のことだ。人間に置き換えれば「暗記型」から「思考型」への変化に近い。知識を持っているだけでなく、知識を使って考えられるかどうか——その差だ。

「初見の難問」に強くなった

AIの思考力を測る試験として「ARC-AGI-2」（エーアールシー・エージーアイ・ツー）と呼ばれるベンチマークがある。米国の非営利団体ARC Prize Foundationが運営する評価指標で、初めて見るパターンの論理パズルを解かせる試験だ。100点満点で、人間が解いた場合の平均は約60点前後とされる。丸暗記では太刀打ちできない設計になっており、AIが「本当に考えられるか」を問う指標として世界的に参照されている。

ARC-AGI-2スコア：31.1点 → 77.1点（約2.5倍）

前のバージョン「Gemini 3 Pro」はこの試験で31.1点だった。今回の「Gemini 3.1 Pro」は77.1点を記録した——人間の平均を超え、約2.5倍の飛躍だ。

この変化の背景には、答えを出す前に「自分の答えは正しいか」を内部で見直すプロセスの強化がある。人間が頭の中で「これで合ってるかな」と一度立ち止まって確認する感覚に近い。その「見直し」の精度が上がったことで、初見の難問でも正解にたどり着けるケースが大幅に増えた。

ChatGPTとの差が開く

中身の変化は、市場の勢力図にも表れている。

ウェブ解析サービスSimilarWebのデータによると、生成AIのウェブサイト訪問シェアは2026年1月時点でChatGPTが64.5%。1年前の86.7%から急落している。一方、Google Geminiは21.5%に達し、初めて20%の大台を突破した。

価格面でも今回の発表は注目を集めた。企業がAIを自社のシステムや外部サービスに組み込む際に使う接続口（APIと呼ばれる仕組み）の利用料金は、ライバルのClaude（クロード）——ChatGPTと並ぶ大手AIサービス——の半額以下でありながら、同等以上の性能を持つという。Googleの公式比較データによる。企業規模でAIを使い込むほど、このコスト差は経営判断に直結してくる。

ビジネスで何が変わるか

市場で選ばれているということは、企業の現場で実際に成果が出ているということでもある。能力が上がれば使い方が変わる。「検索の代わりにAIに聞く」という段階から、「複雑な仕事の一部をAIに任せる」という段階へ——日本企業の現場がそのことを数字で示し始めている。

なお、ここで紹介する事例の多くは、Geminiの以前のバージョンから導入が始まったものだ。ただし、3.1 Proが示した推論力の伸びは、こうした取り組みがより広い業務領域へ広がっていく方向を指し示している。

イオンリテールは衣料品の商品情報を登録する業務にGeminiを導入した。商品ごとに素材・サイズ・用途といった情報を整理してシステムに入力する作業は、判断を伴う細かい繰り返しで、人手に頼るしかなかった。それが変わった。年間4,500人時かかっていた工数が450人時へと9割削減され、人為的なミスもほぼゼロになった。単純な繰り返し作業の効率化ではなく、文脈を読んで判断が必要な工程にまでAIが踏み込んだ結果だ。

J:COMはコールセンターの録音分析にGeminiを使い始めた。大量の通話記録を聞き返して内容を整理する作業は、オペレーターが時間をかけて行うしかない仕事だった。月1,500時間——オペレーター10人分に相当する作業時間が削減された。

企業	業務内容	導入効果
イオンリテール	衣料品商品情報登録	4,500人時→450人時（9割削減）
J:COM	コールセンター録音分析	月1,500時間削減
IVRy	電話自動応答の文脈理解	精度85%→97%
HIS	顧客ニーズ把握ダッシュボード	成約率約5%向上

精度が問われる仕事でも変化は起きている。電話自動応答サービスのIVRy（アイブリー）では、AIが会話の文脈を正しく理解できる精度が85%から97%に上がった。単純な質問への回答だけでなく、前後のやりとりを踏まえた複雑な対応が現実的になってきた。旅行会社のHIS（エイチ・アイ・エス）は顧客ニーズを事前に把握するダッシュボードを構築し、成約率が約5%向上した。顧客が何を求めているかを読み取って提案に反映する——判断が絡む仕事への広がりだ。

海外でも同様の動きがある。カナダの通信大手Bell Canadaは、Geminiを活用したデジタルエージェントの導入で約30億円のコスト削減を達成している。

定型業務の圧縮から、対話的な業務の効率化、そして判断が絡む業務への適用へ。商品情報の文脈判断、通話記録の分析、顧客ニーズの読み取り——これまで人間が担っていた「考える工程」が、静かにAIに移り始めている。日本企業の事例が示しているのは、「AIが使える」フェーズから「AIが仕事の一部を担う」フェーズへの移行だ。

Gemini Google LLM

よかったらシェアしてね！