タグアーカイブ 機械学習

Gemini 3.5 Flash発表、エージェントとコード生成で最上位性能を達成

Gemini 3.5 Flash発表、エージェントとコード生成で最上位性能を達成

Google DeepMindが2026年5月15日、新たなAIモデル「Gemini 3.5」シリーズを発表した。その第一弾として「3.5 Flash」が即日公開され、一般ユーザーから開発者、大企業まで幅広く利用可能になった。

このモデルは「フロンティア知能と行動を融合させた」と表現されるように、高度な推論能力と実世界でのタスク実行力を両立させている。特にエージェント性能とコーディング性能で突出しており、従来の旗艦モデルと同等以上のベンチマークスコアを、4倍の出力速度で実現した。

本記事では、Gemini 3.5 Flashの具体的な性能、Antigravityプラットフォームとの連携、企業導入事例、そして個人向けエージェント「Gemini Spark」までを詳しく解説する。

Gemini 3.5 Flashの登場と基本的位置づけ

Gemini 3.5 Flashの登場と基本的位置づけ

Gemini 3.5シリーズは、Google DeepMindが「より有能でインテリジェントなエージェントの構築」を目的に開発した最新モデル群だ。最初にリリースされた3.5 Flashは、高速応答に定評のあるFlashシリーズの系譜を受け継ぎつつ、旗艦モデルに匹敵する知能を獲得した点が最大の特徴となる。

フロンティア性能の定義

「フロンティア性能」とは、現在実現可能な最高水準のAI能力を指す。この領域では、モデルが単に質問に答えるだけでなく、複雑なワークフローを自律的に計画し、ツールを呼び出し、長期にわたるタスクを完遂することが求められる。

3.5 Flashはこの定義に正面から応える形で設計された。開発者が数日かけるコードベースの移行作業や、監査担当者が数週間要する文書分析を、短時間かつ低コストで遂行できるようになっている。Google DeepMindの発表によれば、コスト面でも他のフロンティアモデルの半額以下で同等以上の成果を出せるとしている。

コード性能とエージェント性能の両立

3.5 Flashの真価は、コーディング能力とエージェント能力の両面で高い成果を示したことにある。従来のモデルは、どちらか一方に特化するか、速度を犠牲にして知能を高める設計が一般的だった。しかし3.5 Flashは、このトレードオフを実用レベルで解消している。

従来の旗艦モデル(Before)
コード生成 高い精度だが 遅い エージェント 長時間タスクでタイムアウト
※性能と速度の間にトレードオフが存在した
Gemini 3.5 Flash(After)
コード生成 高精度 かつ 4倍高速 エージェント 長期タスクも自動完遂
※知能と速度を両立し、トレードオフを解消

この変化により、開発者は応答速度を気にせず複雑なタスクをAIに任せられるようになる。コードベース全体の移行や、複数エージェントを使った並列処理といった高度な活用が現実的になった。

ベンチマークスコアが示す実力

ベンチマークスコアが示す実力

3.5 Flashの性能は、複数の厳格なベンチマークによって裏付けられている。特にエージェント性能を測る指標での躍進が顕著だ。

主要ベンチマークの結果

Google DeepMindの発表資料によると、3.5 Flashは以下のスコアを達成した。

  • Terminal-Bench 2.1(コーディングとエージェントの複合テスト)で76.2%
  • GDPval-AA(エージェント能力のEloレーティング)で1656 Elo
  • MCP Atlas(マルチツール連携の評価)で83.6%
  • CharXiv Reasoning(マルチモーダル理解)で84.2%

これらの数値は、前世代の旗艦モデル「Gemini 3.1 Pro」を上回るだけでなく、一部の指標では競合するクローズドモデルを凌駕する結果となっている。

速度と品質のトレードオフ解消

Artificial Analysisのインデックスでは、3.5 Flashは「知能と出力速度」の散布図で右上の象限に位置している。これは「高い知能を持ちながら極めて高速」であることを示す。具体的には、1秒あたりの出力トークン数が他のフロンティアモデルと比較して4倍に達する場面もある。

従来の選択肢(Before)
低速・高知能モデル 応答に時間がかかりUXが悪化
高速・低知能モデル 精度不足で実用に耐えない
Gemini 3.5 Flash(After)
高速かつ高知能 両立により実用性が飛躍的に向上

これにより、リアルタイム性が求められるチャットアプリや、長時間継続するエージェントタスクの両方で、安定したパフォーマンスを発揮できるようになった。

エージェントタスクの実践力

エージェントタスクの実践力

3.5 Flashの真価は、単独のモデル性能だけでなく、Googleのエージェント開発プラットフォーム「Antigravity」との組み合わせによって最大化される。

Antigravityプラットフォームとの連携

Antigravityは、複数のサブエージェントを協調させて複雑なワークフローを実行するためのハーネスだ。3.5 Flashをこの基盤に載せることで、次のようなタスクが実証されている。

  • 無秩序なファイル群を動的な条件で自動リネーム・分類
  • AlphaZeroの論文を解析し、6時間で完全にプレイ可能なゲームをコーディング
  • レガシーコードベースをNext.jsへ変換・移行
  • 都市景観の生成やブランディングコンセプトの並列作成

これらのタスクは、従来であれば熟練の開発者が数日から数週間かける規模のものだ。3.5 FlashとAntigravityの組み合わせは、単なる「便利なツール」を超えて、開発プロセスそのものを再定義する可能性を秘めている。

長期タスクの自動化事例

Google DeepMindの発表では、3.5 Flashが2つのエージェント(ビルダーとプレイヤー)を並行稼働させ、高速な自己改善ループによってゲームを開発するデモが紹介された。また、研究論文用のインタラクティブなアニメーション生成や、テキスト説明文からのインタラクティブハードウェア設計なども披露されている。

STEP 1 ユーザーが自然言語でタスクを指示
STEP 2 Antigravityが複数のサブエージェントを起動
STEP 3 3.5 Flashがコード生成・テスト・改善を自動実行
STEP 4 完成した成果物をユーザーが受け取る

このフローは、1人の開発者が複数のAIエージェントを指揮する「AIオーケストレーション」の典型例だ。開発者は細かい実装ではなく、全体の方向性と品質判断に集中できるようになる。

企業導入の具体的事例

企業導入の具体的事例

3.5 Flashは発表と同時に、複数の大手企業で実運用が始まっている。Google DeepMindは業界パートナーと密接に連携し、実際の業務で発生する「手間」と「複雑さ」を特定した上でモデルを最適化した。

ShopifyやSalesforceでの活用

Shopifyは、複数のサブエージェントを並列実行し、グローバル規模での加盟店の成長予測を高精度化している。長期的なデータ分析を並列化することで、従来より詳細かつ正確な予測が可能になった。

Salesforceは、自社の「Agentforce」プラットフォームに3.5 Flashを統合した。複数のサブエージェントがコンテキストを保持したまま複数ターンのツール呼び出しを実行し、複雑なエンタープライズタスクを確実に自動化する。これにより、営業担当者が手作業で行っていた見積書作成や顧客データの突合といった業務が大幅に効率化される見込みだ。

金融・会計分野での応用

Macquarie Bankは、100ページを超える複雑なドキュメントを推論し、顧客オンボーディングを高速化する試験運用を開始した。低レイテンシで関連情報を取得し、信頼性の高い推奨事項を提示できる点が評価されている。

会計ソフトウェアのXeroは、サプライヤーの特定や1099税務フォーム用の情報収集といった、数週間かかる管理業務をエージェントに委任する仕組みを構築中だ。これにより、小規模事業者が煩雑な管理タスクから解放され、本業に集中できるようになる。

Databricksは、エージェント型ワークフローを用いてリアルタイム情報の監視と大規模データセットの横断的な推論を行い、データサイエンティスト向けの問題診断と解決策の提案を自動化している。

個人向けエージェント「Gemini Spark」

個人向けエージェント「Gemini Spark」

3.5 Flashは企業向けだけでなく、個人ユーザーの生活にも直接的な変革をもたらす。Google I/O 2026で発表された「Gemini Spark」は、3.5 Flashを中核に据えたパーソナルAIエージェントだ。

24時間稼働のパーソナルエージェント

Gemini Sparkは、ユーザーの指示のもとで24時間365日稼働し、デジタルライフ全般を支援する。メールの整理やスケジュール調整、情報収集といった日常的なタスクを自律的に処理し、ユーザーはより創造的な作業に時間を割けるようになる。

現在は信頼できるテスター向けに展開が始まっており、米国ではGoogle AI Ultraサブスクライバー向けのベータ版が翌週に提供開始される予定だ。日本での展開時期は未発表だが、グローバル展開の一環として近い将来に利用可能になると見られている。

コーディングアシストと検索での応用

3.5 Flashのコーディング能力は、Google検索のAIモードにも統合されている。情報エージェントが24時間働き、動的な生成UIを通じてインタラクティブな解説を提供する。例えば、複雑な数理パターン「Gyroid構造」をビジュアルで示しながら説明するといった使い方が可能だ。

また、Android StudioやGoogle AI Studioを通じて、開発者が3.5 Flashを直接利用できる環境も整っている。個人開発者や中小企業の技術担当者でも、フロンティアクラスのAIを手軽にプロジェクトに組み込めるようになった。

安全性と今後の展望

安全性と今後の展望

高性能なエージェント型AIには、相応の安全対策が不可欠だ。Google DeepMindは、3.5シリーズの開発にあたり「Frontier Safety Framework」に準拠した厳格な安全策を施している。

Frontier Safety Framework

サイバー攻撃やCBRN(化学・生物・放射性物質・核)関連の有害コンテンツ生成を防ぐセーフガードが強化された。同時に、安全なクエリを誤って拒否する「過剰拒否」の問題も改善されている。

このバランスは、新しい安全トレーニング手法と、AIの内部推論を応答前にチェックする解釈可能性ツールの導入によって実現された。モデルが「何を考えているか」を事前に把握し、問題があれば出力前に修正する仕組みだ。

3.5 Proの予告

Google DeepMindは、より大規模な「3.5 Pro」の開発も進めている。すでに社内で使用されており、翌月には公開される見込みだ。Flashの高速性を保ちつつ、さらに高度な推論能力を求めるユースケースに対応する位置づけとなる。

3.5シリーズ全体として、Googleは「エージェントファースト」の開発プラットフォーム戦略を加速させている。AIが単なるアシスタントから、自律的に行動する「デジタルワーカー」へと進化する過渡期にあることを示す重要な発表といえる。

この記事のポイント

  • Gemini 3.5 Flashはエージェント性能とコード生成でフロンティアクラスの成果を達成
  • 従来の旗艦モデルと同等以上の知能を4倍の速度で提供し、実用性が大幅に向上
  • Antigravityとの連携で複数エージェントの協調動作が可能になり、長期タスクの自動化が現実的に
  • ShopifyやSalesforceなど大手企業での導入がすでに始まっており、金融・会計分野でも活用が進む
  • 個人向けエージェントGemini Sparkや検索AIモードへの統合により、一般ユーザーの生活にも直接影響を与える
Googleの新技術TurboQuantが検索とAIの未来を変える

Googleの新技術TurboQuantが検索とAIの未来を変える

Googleがベクトル検索技術の新たな突破口となるTurboQuantを発表した。この技術はAI処理に必要なサイズとメモリ要件を劇的に削減し、検索エンジンの仕組みを根本から変える可能性がある。

TurboQuantは高度なアルゴリズムの集合体で、ベクトルデータベースの構築時間を「ほぼゼロ」に短縮する。従来の検索システムではコストが高く限定的だった大規模な意味検索が、低コストで瞬時に行えるようになる。これは検索結果の質、AI概要の増加、パーソナライズされた検索体験に直接影響を与える技術革新だ。

TurboQuantが解決するベクトル検索の課題

TurboQuantが解決するベクトル検索の課題

TurboQuantの重要性を理解するには、まずベクトル検索の基本とその課題を知る必要がある。従来のキーワードマッチングとは異なるアプローチで、検索エンジンはより深い意味理解を実現しようとしている。

ベクトル埋め込み:言葉を数値に変換する技術

ベクトル埋め込みは、テキストや画像、動画を一連の数値に変換する技術だ。これらの数値は単語や概念の意味的関係をエンコードする。例えば「王様」から「男性」を引き、「女性」を足すと「女王」に近いベクトルが得られる。言葉の数学的操作が可能になるのは、各単語が文脈に基づいてベクトル空間にマッピングされるためだ。

この技術はGoogleが2013年に発表したWord2Vecの研究から発展した。当時から、単語の意味を学習するベクトル表現の可能性は認識されていた。現在の検索エンジンは、この技術をさらに発展させてユーザーの検索意図を深く理解しようとしている。

ベクトル検索とメモリのボトルネック

ベクトル検索は、ベクトル空間内で互いに近い点を見つけるプロセスだ。ユーザーの検索クエリをベクトル空間に埋め込み、意味的に類似したコンテンツを近傍から探し出す。従来のキーワード完全一致ではなく、概念的な関連性に基づく検索が可能になる。

しかし課題があった。多次元空間でのベクトル検索は膨大なメモリを消費する。メモリは近傍探索のボトルネックとなり、大規模なデータセットでの実用的な応用を制限していた。GoogleのエンジニアPandu Nayak氏がDOJ対Google裁判で証言したように、RankBrainのようなシステムでもコストの高い処理であるため、上位20〜30件の結果に限定して適用されていた。

ベクトル量子化の限界とTurboQuantの解決策

メモリ問題に対処するため、ベクトル量子化という技術が開発された。これは巨大なデータポイントのサイズを縮小する数学的手法で、超効率的なzipファイルのようなものだ。しかしデータを圧縮すると結果の品質が低下し、さらに圧縮データに追加されるビットがメモリ負荷を増やすという逆説的な問題があった。

TurboQuantはこの問題を根本から解決する。大きなデータベクトルを回転させて幾何学的に単純化し、JPEG圧縮のように各部分を個別に小さな離散集合にマッピングする。これにより元のベクトルの主要概念を保持しながら、メモリ使用量を大幅に削減できる。隠れたエラーはQJLと呼ばれる数学的手法で1ビットのメモリを使用して検証・修正され、精度を維持したまま高速処理を実現する。

検索エンジンへの具体的な影響

検索エンジンへの具体的な影響

TurboQuantの実用化は、検索エンジンの動作とユーザー体験に具体的な変化をもたらす。従来の技術的制約によって実現できなかった機能が、現実的なコストで提供可能になる。

大規模な意味検索の実現とAI概要の増加

TurboQuantにより、Googleは大規模な意味検索を実行できるようになる。従来はコストが高すぎて上位20〜30件の結果に限定されていたベクトル検索が、数百件の候補に対して瞬時に行える。これによりAI概要(AI Overviews)の質と量が向上し、複雑な質問にも即座にAI生成の回答を提供できるようになる。

Search Engine Journalの記事では、TurboQuantが検索結果の多様性と関連性を高める可能性が指摘されている。ユーザーの特定のニーズと意図に合致した、真に役立つコンテンツがより容易に表面化する仕組みだ。

高度にパーソナライズされた検索体験

Googleが導入したパーソナルインテリジェンスは、TurboQuantによってさらに強化される見込みだ。個人の検索履歴、ドキュメント、メール、好みを瞬時に検索可能なベクトル空間に格納し、リアルタイムのAIアシスタントとして機能する。DeepMind CEOのDemis Hassabis氏が描くユニバーサルAIアシスタントの構想に近づく一歩となる。

視覚データをベクトル空間に変換する技術も進化する。AIグラスやGemini Liveを通じて取得した大量の視覚情報が検索可能になり、「鍵をどこに置いたか」といった日常的な質問にも視覚的記憶に基づいて回答できるようになる。

エージェントシステムとロボティクスの進化

エージェントシステムの能力向上

AIエージェントは従来、コンテキストウィンドウの制限と情報取得の遅さに制約されていた。TurboQuantにより、AIエージェントは無限の完全に想起可能な長期記憶を持つことができる。あらゆるインタラクション、ドキュメント、メール、好みをミリ秒単位で瞬時に検索し、他のエージェントと大量の情報を通信できるようになる。

ロボティクスの実用化加速

ロボットが現実世界で動作する際、周囲の物体の意味的文脈を理解するのは複雑な課題だ。TurboQuantはロボットが環境内の物体を意味的に分類し、適切な行動を判断する能力を大幅に向上させる。Google DeepMindとBoston Dynamicsのパートナーシップも、この技術進化の文脈で捉えることができる。ロボットの知能化と実用化が加速する見込みだ。

SEO担当者への実践的影響

SEO担当者への実践的影響

TurboQuantのような技術進化は、SEOの実践方法に具体的な変化を要求する。単なる技術的最適化から、ユーザー意図の本質的理解へと重心が移行する。

コンテンツ戦略の再考が必要な理由

TurboQuantがもたらす最大の変化は、AI概要がより多くの検索クエリでユーザーを満足させるようになる点だ。世界の情報を整理するだけのコンテンツは、AI回答によって代替される可能性が高まる。一方で、人々がAI回答よりも関わりたいと思うようなコンテンツは、より高い価値を持つようになる。

Search Engine Journalの著者Marie Haynes氏は、自身のコミュニティ「The Search Bar」での議論を紹介している。そこで指摘されているのは、ユーザー意図を徹底的に理解し満たすことに焦点を当てたSEO担当者にとって、基本的なアプローチは変わらないという点だ。しかしビジネスモデルによって影響は異なる。

従来のSEO要素の相対的重要性変化

TurboQuantがGoogleのランキングシステムに導入されれば、意味検索の精度と範囲が拡大する。その結果、従来のSEO要素である被リンクやSEOに特化したコピーの重要性が相対的に低下する可能性がある。Googleは数百件の可能な結果に対して意味検索を行い、ユーザーに瞬時に正確で役立つ情報を提供できるようになる。

技術的な観点から見ると、TurboQuantの研究論文は2025年4月に公開されており、Googleは約1年間かけて改善を重ねてきた。このタイムラインは、2025年6月のコアアップデートで観測された変化の背景にMUVERAというベクトル検索の突破があったとする同氏の以前の推測と一致する。技術の研究公開から実装までには時間的余裕があり、突然の変化ではなく計画的に進化が進んでいる。

AIと検索の未来像

AIと検索の未来像

TurboQuantは単なる技術的改善ではなく、AIと検索の関係性を再定義する転換点となる。Demis Hassabis氏が予測する5〜10年以内のAGI(人工汎用知能)実現に向けた、重要なブレークスルーの一つと位置付けられる。

エージェント型AIの普及とウェブサイトの最適化

エージェント型AIの普及に伴い、ウェブサイトは人間だけでなく機械に対しても情報を伝達できるように最適化する必要が生じる。これは従来のSEOやCRO(コンバージョン最適化)から、AAIO(エージェント型AI最適化)への移行を意味する。コンテンツは構造化され、意味的に明確に記述され、AIエージェントが容易に理解・処理できる形式であることが重要になる。

回答エンジン最適化(Answer Engine Optimization)という概念も注目を集めている。AI応答にコンテンツが採用されるための最適化手法で、従来の検索エンジン最適化とは異なるアプローチが求められる。

技術進化に対応するビジネスモデルの変革

TurboQuantのような技術進化は、一部のビジネスモデルに根本的な変革を迫る。情報のキュレーションを主要な価値提案とするサービスは、AI概要によって需要が減少する可能性がある。一方で、深い専門性、独自の洞察、人間ならではの創造性を提供するコンテンツは、より高い差別化要因となる。

重要なのは、現在のビジネスモデルがAIの進化によってどのような影響を受けるかを客観的に評価し、必要に応じて適応することだ。Marie Haynes氏が提供するGemini Gemは、この評価プロセスを支援するツールとして機能する。複数のドキュメントを知識ベースに入力し、AIの世界でのビジネスの将来についてブレインストーミングを行うことができる。

この記事のポイント

  • GoogleのTurboQuantはベクトル検索のインデックス作成時間を「ほぼゼロ」に短縮し、AI処理のメモリ要件を大幅に削減する技術だ。
  • 従来はコストが高く限定的だった大規模な意味検索が可能になり、AI概要の質と量が向上する見込みである。
  • パーソナライズされた検索体験が強化され、ユニバーサルAIアシスタントの実現に近づく。
  • SEOにおいては、ユーザー意図の本質的理解と真に役立つコンテンツの提供が従来以上に重要になる。
  • エージェント型AIの普及に伴い、ウェブサイトは機械に対しても情報を伝達できる最適化(AAIO)が必要となる。