タグアーカイブ Gemini

Google AI Threat Defense発表、AIで脆弱性を自動修正する次世代セキュリティ

Google Cloudは2026年5月27日、AIを活用したセキュリティプラットフォーム「Google AI Threat Defense」を発表した。このシステムは脆弱性のスキャンから修正までを自律的に実行し、攻撃者が悪用する前に防御を固めることを目的としている。

AIの進化に伴い、攻撃者は従来の手作業による対策では追いつけないスピードで脆弱性を悪用するようになった。AI Threat DefenseはWiz、CodeMender、Gemini、Mandiantの各テクノロジーを統合し、組織が機械的な速度で脅威に対抗できる環境を提供する。

AI Threat Defenseが目指す次世代セキュリティ

AI Threat Defenseが目指す次世代セキュリティ

近年、サイバー攻撃の高速化が顕著だ。従来は数週間かけて実施されていた攻撃が、AIエージェントの支援により数時間〜1日程度で完了するケースが増えている。防御側もこのスピードに追随する必要があり、人手による脆弱性管理やパッチ適用だけでは限界がある。

Google Cloud Blogの記事では、単一のAIモデルですべての脆弱性を捕捉することは難しく、コストと性能のバランスを取るために軽量なモデルと最先端のモデルを組み合わせて使うマルチモデル戦略が有効だと説明している。AI Threat Defenseは、ジェネレーティブAIの推論能力とコード生成能力を核に据えた自動防御システムとして、この考え方を具現化したものだ。

従来の脆弱性管理(Before)
人手中心のスキャンと手動パッチ適用
脆弱性発見から修正まで数週間
大量のアラートに埋もれ、優先順位付けに時間がかかる
AI Threat Defense(After)
AIによる自動スキャン・優先順位付け・パッチ生成
数分〜数時間で修正完了
実際に悪用可能なリスクのみを抽出し、開発者の負荷を軽減

上の比較は、従来型の反応的なセキュリティ運用と、AI Threat Defenseがもたらす自律的な運用の差を端的に表している。プロセス全体が機械速度で回ることで、攻撃者が脆弱性を悪用する「タイムウィンドウ」を最小化できる点が最大の強みだ。

4つのコンポーネントが支える統合防御

4つのコンポーネントが支える統合防御

AI Threat Defenseは、単一の製品ではなく、複数のクラウドセキュリティ技術を組み合わせた統合プラットフォームだ。基盤にはGoogleのジェネレーティブAIモデル「Gemini」の推論エンジンがあり、周辺にクラウドセキュリティの可視化を担うWiz、コード修正を自動化するCodeMender、そして現場のサイバー攻撃対策ノウハウを持つMandiantが配置される。

Wizによる可視化とリスク優先付け

WizはアプリケーションやAPI、ID、設定、ビジネスロジックなど、クラウド環境のあらゆる要素を継続的に可視化し、実際に悪用可能な攻撃パスをマッピングする。従来の攻撃面管理(ASM)を超え、AIペネトレーションテストエージェントが複雑な連鎖リスクを自動検証する。この結果、ただの脆弱性リストではなく、事業リスクを反映した優先順位付きの修復計画が出力される。

CodeMenderによる自律的なコード修正

CodeMenderはGeminiのコード生成力を活用し、開発者のIDEやCLIに直接パッチ候補を提示する。脆弱なコードの置換、レガシーコードのメモリ安全な言語への書き換え、ライブラリ依存関係の調整までをカバーし、修正後の自動テスト生成も行う。これにより、パッチの生成から検証までの時間が大幅に短縮される。

Geminiの推論とマルチモデル戦略

AI Threat DefenseはGemini Enterprise Agent Platform上で複数の最先端モデルを動かし、モデルごとに得意なタスク(アプリケーションロジック分析、クラウド設定監査、バイナリ解析など)に割り当てる。軽量モデルで広くスキャンし、フロンティアモデルを最高リスク領域に集中させることで、コスト効率と検出範囲の両立を実現している。

Mandiantの現場知見と運用ガイダンス

Mandiantはこれまでに蓄積したサイバー攻撃の最前線知識を、AI駆動の修復プロセスに注入する。重大な脆弱性が一気に表面化した場合の対応戦略や、旧式システムの安全な停止方法、AI生成パッチをエンジニアリングチームに負荷をかけずに展開するノウハウなど、実践的なガイダンスが提供される。

脅威対策の4段階フレームワーク

脅威対策の4段階フレームワーク

AI Threat Defenseの運用は「準備(Prepare)」「スキャンと優先順位付け(Scan and prioritize)」「修正(Remediate)」「監視(Monitor)」の4段階で構成される。各ステップがシームレスに連携し、攻撃者が悪用するスピードに追いつくための機械的なワークフローを形成する。

STEP 1 準備 基盤を強化し、リスク露出を削減する
STEP 2 スキャンと優先順位付け 深掘り分析とAIによる悪用可能性の検証
STEP 3 修正 自律的にパッチを生成・適用し、修正を検証
STEP 4 監視 継続的な検出とリアルタイム対応

このフレームワークでは、各段階が独立しているのではなく、リアルタイムのリスク情報に基づいてループする。たとえば監視中に新たな暴露経路が見つかれば、即座にスキャンへ戻り、自動的にパッチが生成される。

STEP 1 準備(Prepare)

まず重要なのは、攻撃対象領域を最小化することだ。インターネットから直接到達可能なセンシティブな資産や、信頼できない経路で露出しているサービスを特定し、パッチの有無にかかわらず接続経路そのものを削減する。同時に、各チームの責任範囲とエスカレーションフローを明確化し、次の脆弱性が発見されたときに即応できる体制を整える。

STEP 2 スキャンと優先順位付け(Scan and prioritize)

この段階では、AIによる多層的な分析が行われる。軽量モデルで全資産を継続的にウォッチしつつ、インターネット向けアプリケーションや認証機能などビジネスクリティカルな部分にはフロンティアモデルを用いた深掘りスキャンを実施する。Wizのリアルタイムコンテキストと連携し、単なるコード上の欠陥ではなく「実際に攻撃可能か」という観点で優先度が決定される。

STEP 3 修正(Remediate)

特定された脆弱性は、CodeMenderによって自動的に修正案が生成される。開発者はIDE上でパッチ候補を確認し、承認するだけでよい。また、ライブラリの変更が他のコンポーネントに与える影響も分析され、複数リポジトリにまたがる安全なロールアウトが支援される。修正後には自動テストが走り、パッチの有効性を検証する仕組みも組み込まれている。

STEP 4 監視(Monitor)

最後の監視フェーズでは、Google Security Operationsが提供するエージェント型SOC機能を活用し、ネットワーク、ID、アプリケーションのテレメトリを横断的に分析する。AIが不審な挙動を自律的に検出し、場合によっては自動で封じ込めアクションを発動する。また、日次でビルド・署名されたハードニング済みコンテナイメージを用いることで、基盤自体のセキュリティも維持される。

実践導入とパートナーエコシステム

実践導入とパートナーエコシステム

AI Threat Defenseは、単にツールを導入するだけでは機能しない。クラウドアーキテクチャに適したセキュリティ設計と、既存の開発パイプラインへの組み込みが必要になる。そのため、Google CloudはAccenture、Deloitte、PwC、Netenrich、TENEX.AIなどのパートナー企業と協業し、導入から継続的な管理、カスタムワークフローの構築までを支援する体制を整えている。

パートナー企業の役割

各パートナーは、顧客固有のクラウド構成を評価し、AI駆動のセキュリティ運用を定着させるためのハーネス(カスタム連携基盤)を開発する。これにより、組織ごとのコンプライアンス要件や運用ポリシーに合わせたきめ細かな防御が可能になる。

Google自身のセキュリティ実績

Google Cloudは、このプラットフォームを自らのセキュリティ運用実績の上に構築している。同社は10年以上にわたり、Titanチップによるハードウェア保護やZero Trustアーキテクチャの先駆的導入を進めてきた。現在も毎分数千万件のスパムを自動ブロックし、数十億のユーザーを保護している。こうしたノウハウが、AI Threat Defenseの設計思想に深く反映されている。

この記事のポイント

  • AI攻撃の高速化に対抗するため、Google Cloudが自律型防御プラットフォーム「AI Threat Defense」を発表
  • Wiz、CodeMender、Gemini、Mandiantの4要素を統合し、脆弱性の可視化からパッチ適用までを機械速度で自動化
  • 従来の人間主導のプロセスでは数週間かかっていた対応が、数分〜数時間に短縮される見込み
  • 「準備→スキャン→修正→監視」の4段階フレームワークで、攻撃者が悪用する前に防御を完了させる
  • パートナー企業による実装支援と既存の開発パイプラインへの統合が、導入の鍵を握る
Google APIキーを守る3つの基本手順、悪用と高額請求のリスクを下げる

Google APIキーを守る3つの基本手順、悪用と高額請求のリスクを下げる

Google Geminiを含むAIサービスやGoogle Cloud APIを利用する上で、APIキーの安全な管理は避けて通れない課題だ。適切な対策を怠ると、キーの漏洩や悪用により、高額な請求やプロジェクト環境の侵害を引き起こす可能性がある。

APIキーは「使うのは簡単だが、安全でない方法で使うのも同じくらい簡単」とGoogle Cloud Blogの著者Leonid Yankulin氏は指摘する。この記事では、Googleが提供するAPIキーのリスクを大幅に下げるための、すぐに実践できる具体的な手順を解説する。

これらの対策の多くは、Googleに限らず他のサービスで発行されるAPIキーやプロダクトトークンにも応用可能だ。個人開発者から組織の管理者まで、キーの取り扱いを見直すきっかけにしてほしい。

Step 1. 新しいAPIキーは「隔離」と「制限」が大前提

Step 1. 新しいAPIキーは「隔離」と「制限」が大前提

APIキーを作成する際、最初からセキュリティを考慮しておくことで、後々のトラブルを未然に防げる。「とりあえず作成」して放置されている無制限のキーが、組織における最大のリスク要因の一つだ。

キーは専用プロジェクトで作成する

新しいAPIキーを生成する最初のルールは、他の目的に使っていない独立したGoogle Cloudプロジェクト内で作成すること。これにより、仮にキーが漏洩しても、被害がそのプロジェクトのリソースに限定される。

プロジェクトを分けることは、問題発生時の原因特定と影響範囲の調査を大幅に容易にする。本番環境と同じプロジェクトで実験用のAPIキーを発行するといった行為は避けるべきだ。

API制限で「できること」を絞る

APIキーを作成する際、デフォルトではAPI制限がかかっていない。これは、そのキーが有効化されているすべてのサービスにアクセスできる状態を意味する。Google Cloud Blogの著者は「制限のないキーを絶対に作るな」と強調する。

API制限を設定することで、キーがアクセスできるサービスを特定のAPIだけに絞り込める。たとえば、AI Studioで利用するなら「Gemini API」のみ、地図機能だけが必要なら「Maps API」だけに制限する。漏洩時の攻撃範囲を最小化する考え方だ。

注意すべき副次的なポイントとして、AI StudioやFirebaseなど間接的なUIからキーを作成した場合、意図しないAPI群が自動で許可されているケースがある。Firebase経由で作ったキーは24ものAPI(DatastoreやFirestore、Cloud SQLなど)へのアクセスが許可されるため、不要なものは手動で外す必要がある。

未制限キーのリスク(Before)
流出キー Gemini API Maps API Cloud SQL Firestore
あらゆるAPIにアクセスされ、被害が拡大
制限設定後のキー(After)
流出キー Gemini API Maps API Cloud SQL Firestore
Gemini APIだけが悪用されるが、他のサービスは保護される

制限したいAPIが一覧に表示されない場合は、そのAPIが対象プロジェクトで有効化されていない可能性が高い。APIライブラリから事前に有効化しておく必要がある。

アプリケーション制限で「使う場所」を縛る

API制限が「どのサービスを使えるか」を制御するのに対し、アプリケーション制限は「どのアプリからキーを使えるか」を制御する。こちらも併用することで、セキュリティは飛躍的に高まる。

たとえばAI Studio専用のキーなら、許可するウェブサイトを aistudio.google.com に限定すれば、他のスクリプトや自動化ツールから大量のトークンを消費されるリスクを防げる。指定できる制限タイプは以下の4種類だ。

  • ウェブサイト、許可するURLのリストを指定
  • サービス(IPアドレス)、IPv4やIPv6アドレス、サブネットマスクで指定
  • iOSアプリ、バンドルIDで指定
  • Androidアプリ、パッケージ名と証明書フィンガープリントのペアで指定

注意点として、1つのキーに設定できるアプリケーション制限タイプは1種類だけ。複数のアプリ種別で利用する場合は、それぞれ専用のAPIキーを発行する。キーをアプリごとに分けておけば、利用状況の監視や侵害発生時の調査も容易になる。

アプリケーション制限の設定イメージ(AI Studio専用キーの場合)
許可アプリ
ウェブサイト https://aistudio.google.com
ブロックされるアクセス例
自動化スクリプトからの呼び出し、不明なIPアドレスからのリクエスト、許可リストにないWebサイト

Step 2. APIキーは「誰でも使える」前提で保管する

Step 2. APIキーは「誰でも使える」前提で保管する

APIキーの最大の特性は、特定の個人アカウントと紐づかない点にある。Google Cloud Blogの記事で「誰でも使える」と強調されているように、キー文字列を知っていれば誰でもその権限でAPIを呼び出せる。保管の安全性の重要性はAPI制限と同等だ。

「APIキーを絶対に、見えやすい場所に保存してはいけない」という基本ルールはシンプルだが、実際の開発現場ではしばしば破られている。ソースコードへのハードコードや、Gitリポジトリへの平文でのコミットは典型的なミスだ。

自社アプリケーションではSecret Managerを使う

Google Cloudを利用しているなら、Secret Manager(シークレットマネージャー)のような専用の機密情報管理サービスにキーを格納するのが鉄則だ。Secret Managerを使えば、APIキーをCloud RunやGKEの実行環境に安全に注入できる。

さらに保護レベルを上げたい場合は、キーを環境変数に渡すのではなく、アプリケーションコード内でSecret Managerから直接読み取る方式も選択肢になる。これによりランタイムメモリへの露出時間をさらに短縮できる。

外部アプリケーションではキーの取り扱いを事前調査する

サードパーティ製のツールやサービスにAPIキーを入力する場合、そのアプリケーションがキーをどのように保管し、通信しているかを確認する必要がある。

Webアプリケーションであれば、ブラウザの開発者ツールを使ってトラフィックを調査し、キーが暗号化されていない通信経路で送信されていないかを確認する。「Google AI Studioは暗号化されたローカルストレージを使用し、TLS暗号化チャネル経由でのみキーを送信する」とYankulin氏は具体例を挙げている。こうした設計を満たしていないツールへのキー提供は避けるべきだ。

安全なキー保管のチェックフロー
STEP 1 キーをソースコードに書いていないか確認
STEP 2 Secret Managerなど専用サービスに格納する
STEP 3 外部ツール利用時は、暗号化保存とTLS通信を確認する
STEP 4 Gitのコミット履歴にもキーが含まれていないか最終チェック

異常を検知したら「即削除」、調査の手順も把握する

異常を検知したら「即削除」、調査の手順も把握する

どんなに対策を施しても、キーが侵害される可能性はゼロにはできない。迅速な初動対応が被害を最小化する鍵を握る。Yankulin氏は「クレジットカードを無くしたときと同じように、まずキーを削除すること」と述べている。

Cloudコンソール、または gcloud services api-keys delete コマンドで即座にキーを無効化する。誤報だったと判明した場合でも、削除から30日以内であれば undelete コマンドで復元が可能だ。

侵害されたキーを特定する2段階調査

どのAPIキーが侵害されたか不明な場合は、以下の2段階で調査を進める。

第一段階、組織またはプロジェクト内のすべてのAPIキーを洗い出す。Cloudコンソールの「Asset Inventory」でリソースタイプを apikeys.Key に絞り込む方法と、gcloud services api-keys list コマンドを使う方法がある。組織全体を横断検索する場合は gcloud asset search-all-resources コマンドでJSON出力をフィルタリングする。

第二段階、API消費量のグラフを確認する。Cloud Monitoringの指標 serviceruntime.googleapis.com/api/request_count を使い、credential_id ラベルで特定のAPIキーIDに絞り込む。リクエスト数が異常に急増している場合、そのキーが悪用されている可能性が高い。

APIキーIDは、Cloudコンソールの「Credentials」ページでキーを選択した際のURL(/key/[KEY_ID] 部分)から、または gcloud services api-keys list --format='value(displayName,uid)' コマンドで確認できる。

API消費量の異常検知イメージ
通常時のリクエスト数
1時間あたり数千リクエスト。日次グラフはなだらかで安定した波形
侵害発生時のリクエスト数
1時間あたり数十万リクエストに急増。短時間で不自然なスパイクが出現
異常なスパイク  通常レンジ

Step 3. 日常的な「APIキー衛生管理」を習慣化する

Step 3. 日常的な「APIキー衛生管理」を習慣化する

エンジニアだけの話ではない。クラウドをかじり始めたばかりの個人ユーザーも、今すぐAPIキーの「衛生管理」を始めるべきだ。放置されたキーは、知らぬ間に悪用の温床となる。

Yankulin氏が推奨する即時実行すべきアクションは以下の5つだ。

  • 自分が保有するすべてのAPIキーを洗い出す
  • 使っていないキー、見覚えのないキーはすべて削除する(30日以内なら復元可能)
  • 残すキーは、利用するAPIだけに制限し、可能ならクライアントも絞り込む
  • 組織の管理者は apikeys.googleapis.com/Key の組織ポリシーを設定し、キーの乱立と制限設定の抜けを防ぐ
  • 定期的なキーのローテーション(再発行と差し替え)を検討する。ただし、既存キーを削除する前に、すべての利用箇所を特定して新しいキーに更新する周到さが必要だ

キーローテーションの際に「既存キーがどこで使われているのか把握しきれていない」という問題に直面するケースは多い。日頃からキーの利用箇所をドキュメント化しておくこと、そして新しいキーの発行時点から適切な制限をかけておくことが、結果的にローテーションのハードルを下げる。

キー衛生管理の3大習慣
棚卸し 全プロジェクトのAPIキーを月次でリストアップし、使っていないものは即削除
制限設定 新規キーは必ずAPI制限とアプリケーション制限をかけてから使い始める
ローテーション 四半期ごとにキーを再発行し、利用箇所を更新。跡地の旧キーは速やかに削除

この記事のポイント

  • APIキーは「誰でも使える」クレデンシャル。見える場所に保管しないことが大前提
  • 新規キー作成時は、API制限とアプリケーション制限を両方設定して攻撃の範囲を狭める
  • 保管にはSecret Managerなど専用の機密情報管理サービスを使い、コードへのハードコードを避ける
  • 使っていないキーや制限のないキーは即座に削除し、組織ポリシーで乱立を防ぐ
  • 侵害が疑われる場合はクレジットカードと同じ感覚で「まず削除」。監視データで異常を検知する
Google Antigravity 2.0リリース、IDE不要のエージェント体験を実現

Google Antigravity 2.0リリース、IDE不要のエージェント体験を実現

Google DeepMindは2026年5月17日、AIエージェントを中核に据えたデスクトップアプリケーション「Google Antigravity 2.0」を発表した。従来のIDE(統合開発環境)を廃し、エージェントとの同期・非同期の対話に完全に最適化された独立アプリケーションとして再設計されている点が最大の特徴だ。

この新バージョンは、2025年11月にリリースされた初代Antigravity IDEの「Agent Manager」を発展させたもので、ソフトウェア開発だけでなく、より広範な知識作業をエージェントと協働するための基盤として位置づけられている。macOS、Linux、Windowsに対応し、最新のGeminiモデルを活用する。

開発者だけでなく、コードやIDEに馴染みのないユーザーにとっても直感的なエージェント体験を提供することが、この2.0の大きな狙いだ。

エージェントファーストの新設計

エージェントファーストの新設計
従来のAntigravity IDE(Before)
IDEとAgent Managerが同一アプリ内に混在
コードエディタ エージェント ターミナル
IDEの概念が常に付随、非開発者には不慣れ
Antigravity 2.0(After)
エージェントとの対話と成果物に集中
会話 成果物 フィードバック
コード不要、誰でもすぐに使える

Antigravity 2.0の最大の転換点は、IDEという概念を完全に取り除いたことにある。従来のAntigravity IDEでは、コードエディタとエージェント管理画面が同居していた。この設計は開発者には便利だが、エージェント本来の可能性を制限する側面もあった。

IDEを捨てた理由

Google DeepMindの記事によれば、開発チームは当初から「コーディングの高速化だけでは、ユーザーに提供できる価値に限界がある」と認識していたという。モデル性能が向上するにつれ、エージェントの活躍領域は自然とコード以外の知識作業へと拡大した。

実際、初代Antigravity IDEのAgent Managerは、開発以外のタスクにも広く使われていた。だが、IDEの枠組みの中でそれを行うのは、非開発者にとっては直感的とは言えなかった。Antigravity 2.0は、その制約を解消し、エージェントとの協働を主役に据えた設計へと舵を切った。

プロジェクトベースの管理方式

もう一つの大きな設計変更が、リポジトリとの密結合の解除だ。Antigravity 2.0では、エージェントの会話は「ワークスペース(リポジトリ)」単位ではなく、「プロジェクト」単位でグループ化される。一つのプロジェクトが複数のフォルダを参照でき、プロジェクトごとにエージェントの設定や権限を個別に定義できる。

これにより、エージェントがより多くの情報源にアクセスし、複雑なタスクに取り組めるようになりつつ、適切なガードレールも維持される。

強化されたエージェント機能群

強化されたエージェント機能群
STEP 1 ユーザーがメインエージェントにタスクを指示
STEP 2 メインエージェントがサブエージェントを動的に生成
STEP 3 サブエージェントが部分タスクを並列実行、非同期で結果を返す
メインエージェント  サブエージェント生成  非同期タスク完了

Antigravity 2.0では、エージェントの能力が大幅に強化された。中核となるのは「動的サブエージェント」「非同期タスク管理」「JSONフック」の3つだ。

動的サブエージェント

メインエージェントがタスクを実行する際、必要に応じてサブエージェントを動的に定義し、呼び出せるようになった。サブエージェントは焦点を絞った部分タスクを担当する。これにより、メインエージェントのコンテキストウィンドウが汚染されず、複数のサブタスクを並列に処理できる。

コンテキストウィンドウとは、エージェントが一度に把握できる会話や情報の範囲のことだ。長大なタスクではここがすぐに一杯になり、エージェントの応答品質が落ちる原因になっていた。サブエージェントへの委譲は、この問題への有効な対策となる。

非同期タスク管理

タスクやコマンドを非同期で実行できるようになった点も大きい。メインエージェントが処理をブロックされることなく、バックグラウンドで複数の作業を進められる。たとえば、コードのビルドを走らせながら次の機能の設計について対話を続ける、といった並行作業が可能になる。

JSONフック

JSONフックは、エージェントの動作を外部から制御する仕組みだ。シンプルなJSON形式でフックを定義し、エージェントの特定の挙動をインターセプトして制御できる。柔軟なカスタマイズを可能にしつつ、設定の複雑さを抑えている。

スケジュールタスクとプロジェクト管理

スケジュールタスクとプロジェクト管理
スケジュールタスクの流れ
ユーザー /schedule コマンドで指示 Antigravity cron式で定期実行を登録
Antigravity 設定時刻にエージェントを自動起動 エージェント タスク実行、結果を通知

Antigravity 2.0では、エージェントとの新しい関わり方として「スケジュールタスク」が導入された。cron式を使ってエージェントの起動スケジュールを事前に定義できる。日次レポートの生成、定期的なデータ収集、ナイトリービルドの監視など、手動で毎回指示を出す必要がなくなる。

スラッシュコマンド「/schedule」を使うか、専用のスケジュールタスク画面から設定する。一度だけのタイマー実行と、繰り返しの定期実行の両方に対応している。

新しいスラッシュコマンドと音声入力

/goal
指定タスクを完了まで実行、中間確認なし
/grill-me
実装前に計画の詳細を質問で確認
/schedule
タイマーまたは定期実行のスケジュールを設定
/browser
ブラウザ操作を明示的に指示、使用しない時は無視

Antigravity 2.0には、エージェントとの対話をより精密に制御するための新しいスラッシュコマンドが追加された。

4つの新コマンド

/goalは、指定したタスクを完了まで実行させ、途中でユーザーに入力を求めない。長時間の作業を任せきりにしたい場面で有効だ。/grill-meは実装開始前に、エージェントが逆に質問を投げかけて計画の詳細を詰める。見落としを事前に洗い出すのに役立つ。/scheduleは前述のとおり、タスクのスケジュール実行を指示する。/browserは、エージェントにブラウザ操作を明示的に許可するかどうかを制御する。

音声入力のライブ文字起こし

テキスト入力欄の横にあるマイクアイコンを使った音声入力が、ライブ文字起こしに対応した。従来は生の音声ファイルをモデルに渡していたが、2.0では発話と同時にテキスト化が進む。音声の遅延を感じさせず、より自然な対話が可能になった。

Antigravity IDEとの関係と今後の展望

Antigravity IDEとの関係と今後の展望

Antigravity 2.0は独立したアプリケーションとして提供されるが、従来のAntigravity IDEがすぐに置き換わるわけではない。IDE側のAgent Managerも当面は維持され、今後のアップデートでIDEからAgent Managerが分離される予定だ。IDEは純粋なエージェント駆動型IDEとして残る。

すでにAntigravity IDEをインストールしているユーザーは、次回のアップデートで自動的にAntigravity 2.0に更新される。その際、IDEを残すかどうかを選択できる。両アプリはドック上でアイコン背景が異なり、2.0は白背景、IDEは黒グリッド背景で区別される。

Google DeepMindの記事によれば、社内のGooglerたちはすでにAntigravity 2.0と各種IDEを併用しているという。今後、主要なIDE向けの互換拡張機能やプラグインも提供される予定だ。

今後のロードマップ

Antigravity 2.0と同時に、CLI、SDK、APIも発表された。他のGoogle製品や技術スタックとの統合も進められており、エージェントハーネスとモデル層の共同最適化が継続される。記事では、リモートコントロール機能、さらなる製品統合、クラウドデプロイエージェントなどが今後の展開として示唆されている。

この記事のポイント

  • Antigravity 2.0はIDEを廃した完全エージェントファーストの独立アプリケーション
  • 動的サブエージェントと非同期タスク管理で複雑な作業を効率的に処理
  • スケジュールタスクにより、エージェントの定期実行が自動化可能
  • 音声入力がライブ文字起こしに対応し、対話のテンポが向上
  • 従来のIDEも維持され、開発者は両方を併用できる
Gemini 3.5 Flash発表、エージェントとコード生成で最上位性能を達成

Gemini 3.5 Flash発表、エージェントとコード生成で最上位性能を達成

Google DeepMindが2026年5月15日、新たなAIモデル「Gemini 3.5」シリーズを発表した。その第一弾として「3.5 Flash」が即日公開され、一般ユーザーから開発者、大企業まで幅広く利用可能になった。

このモデルは「フロンティア知能と行動を融合させた」と表現されるように、高度な推論能力と実世界でのタスク実行力を両立させている。特にエージェント性能とコーディング性能で突出しており、従来の旗艦モデルと同等以上のベンチマークスコアを、4倍の出力速度で実現した。

本記事では、Gemini 3.5 Flashの具体的な性能、Antigravityプラットフォームとの連携、企業導入事例、そして個人向けエージェント「Gemini Spark」までを詳しく解説する。

Gemini 3.5 Flashの登場と基本的位置づけ

Gemini 3.5 Flashの登場と基本的位置づけ

Gemini 3.5シリーズは、Google DeepMindが「より有能でインテリジェントなエージェントの構築」を目的に開発した最新モデル群だ。最初にリリースされた3.5 Flashは、高速応答に定評のあるFlashシリーズの系譜を受け継ぎつつ、旗艦モデルに匹敵する知能を獲得した点が最大の特徴となる。

フロンティア性能の定義

「フロンティア性能」とは、現在実現可能な最高水準のAI能力を指す。この領域では、モデルが単に質問に答えるだけでなく、複雑なワークフローを自律的に計画し、ツールを呼び出し、長期にわたるタスクを完遂することが求められる。

3.5 Flashはこの定義に正面から応える形で設計された。開発者が数日かけるコードベースの移行作業や、監査担当者が数週間要する文書分析を、短時間かつ低コストで遂行できるようになっている。Google DeepMindの発表によれば、コスト面でも他のフロンティアモデルの半額以下で同等以上の成果を出せるとしている。

コード性能とエージェント性能の両立

3.5 Flashの真価は、コーディング能力とエージェント能力の両面で高い成果を示したことにある。従来のモデルは、どちらか一方に特化するか、速度を犠牲にして知能を高める設計が一般的だった。しかし3.5 Flashは、このトレードオフを実用レベルで解消している。

従来の旗艦モデル(Before)
コード生成 高い精度だが 遅い エージェント 長時間タスクでタイムアウト
※性能と速度の間にトレードオフが存在した
Gemini 3.5 Flash(After)
コード生成 高精度 かつ 4倍高速 エージェント 長期タスクも自動完遂
※知能と速度を両立し、トレードオフを解消

この変化により、開発者は応答速度を気にせず複雑なタスクをAIに任せられるようになる。コードベース全体の移行や、複数エージェントを使った並列処理といった高度な活用が現実的になった。

ベンチマークスコアが示す実力

ベンチマークスコアが示す実力

3.5 Flashの性能は、複数の厳格なベンチマークによって裏付けられている。特にエージェント性能を測る指標での躍進が顕著だ。

主要ベンチマークの結果

Google DeepMindの発表資料によると、3.5 Flashは以下のスコアを達成した。

  • Terminal-Bench 2.1(コーディングとエージェントの複合テスト)で76.2%
  • GDPval-AA(エージェント能力のEloレーティング)で1656 Elo
  • MCP Atlas(マルチツール連携の評価)で83.6%
  • CharXiv Reasoning(マルチモーダル理解)で84.2%

これらの数値は、前世代の旗艦モデル「Gemini 3.1 Pro」を上回るだけでなく、一部の指標では競合するクローズドモデルを凌駕する結果となっている。

速度と品質のトレードオフ解消

Artificial Analysisのインデックスでは、3.5 Flashは「知能と出力速度」の散布図で右上の象限に位置している。これは「高い知能を持ちながら極めて高速」であることを示す。具体的には、1秒あたりの出力トークン数が他のフロンティアモデルと比較して4倍に達する場面もある。

従来の選択肢(Before)
低速・高知能モデル 応答に時間がかかりUXが悪化
高速・低知能モデル 精度不足で実用に耐えない
Gemini 3.5 Flash(After)
高速かつ高知能 両立により実用性が飛躍的に向上

これにより、リアルタイム性が求められるチャットアプリや、長時間継続するエージェントタスクの両方で、安定したパフォーマンスを発揮できるようになった。

エージェントタスクの実践力

エージェントタスクの実践力

3.5 Flashの真価は、単独のモデル性能だけでなく、Googleのエージェント開発プラットフォーム「Antigravity」との組み合わせによって最大化される。

Antigravityプラットフォームとの連携

Antigravityは、複数のサブエージェントを協調させて複雑なワークフローを実行するためのハーネスだ。3.5 Flashをこの基盤に載せることで、次のようなタスクが実証されている。

  • 無秩序なファイル群を動的な条件で自動リネーム・分類
  • AlphaZeroの論文を解析し、6時間で完全にプレイ可能なゲームをコーディング
  • レガシーコードベースをNext.jsへ変換・移行
  • 都市景観の生成やブランディングコンセプトの並列作成

これらのタスクは、従来であれば熟練の開発者が数日から数週間かける規模のものだ。3.5 FlashとAntigravityの組み合わせは、単なる「便利なツール」を超えて、開発プロセスそのものを再定義する可能性を秘めている。

長期タスクの自動化事例

Google DeepMindの発表では、3.5 Flashが2つのエージェント(ビルダーとプレイヤー)を並行稼働させ、高速な自己改善ループによってゲームを開発するデモが紹介された。また、研究論文用のインタラクティブなアニメーション生成や、テキスト説明文からのインタラクティブハードウェア設計なども披露されている。

STEP 1 ユーザーが自然言語でタスクを指示
STEP 2 Antigravityが複数のサブエージェントを起動
STEP 3 3.5 Flashがコード生成・テスト・改善を自動実行
STEP 4 完成した成果物をユーザーが受け取る

このフローは、1人の開発者が複数のAIエージェントを指揮する「AIオーケストレーション」の典型例だ。開発者は細かい実装ではなく、全体の方向性と品質判断に集中できるようになる。

企業導入の具体的事例

企業導入の具体的事例

3.5 Flashは発表と同時に、複数の大手企業で実運用が始まっている。Google DeepMindは業界パートナーと密接に連携し、実際の業務で発生する「手間」と「複雑さ」を特定した上でモデルを最適化した。

ShopifyやSalesforceでの活用

Shopifyは、複数のサブエージェントを並列実行し、グローバル規模での加盟店の成長予測を高精度化している。長期的なデータ分析を並列化することで、従来より詳細かつ正確な予測が可能になった。

Salesforceは、自社の「Agentforce」プラットフォームに3.5 Flashを統合した。複数のサブエージェントがコンテキストを保持したまま複数ターンのツール呼び出しを実行し、複雑なエンタープライズタスクを確実に自動化する。これにより、営業担当者が手作業で行っていた見積書作成や顧客データの突合といった業務が大幅に効率化される見込みだ。

金融・会計分野での応用

Macquarie Bankは、100ページを超える複雑なドキュメントを推論し、顧客オンボーディングを高速化する試験運用を開始した。低レイテンシで関連情報を取得し、信頼性の高い推奨事項を提示できる点が評価されている。

会計ソフトウェアのXeroは、サプライヤーの特定や1099税務フォーム用の情報収集といった、数週間かかる管理業務をエージェントに委任する仕組みを構築中だ。これにより、小規模事業者が煩雑な管理タスクから解放され、本業に集中できるようになる。

Databricksは、エージェント型ワークフローを用いてリアルタイム情報の監視と大規模データセットの横断的な推論を行い、データサイエンティスト向けの問題診断と解決策の提案を自動化している。

個人向けエージェント「Gemini Spark」

個人向けエージェント「Gemini Spark」

3.5 Flashは企業向けだけでなく、個人ユーザーの生活にも直接的な変革をもたらす。Google I/O 2026で発表された「Gemini Spark」は、3.5 Flashを中核に据えたパーソナルAIエージェントだ。

24時間稼働のパーソナルエージェント

Gemini Sparkは、ユーザーの指示のもとで24時間365日稼働し、デジタルライフ全般を支援する。メールの整理やスケジュール調整、情報収集といった日常的なタスクを自律的に処理し、ユーザーはより創造的な作業に時間を割けるようになる。

現在は信頼できるテスター向けに展開が始まっており、米国ではGoogle AI Ultraサブスクライバー向けのベータ版が翌週に提供開始される予定だ。日本での展開時期は未発表だが、グローバル展開の一環として近い将来に利用可能になると見られている。

コーディングアシストと検索での応用

3.5 Flashのコーディング能力は、Google検索のAIモードにも統合されている。情報エージェントが24時間働き、動的な生成UIを通じてインタラクティブな解説を提供する。例えば、複雑な数理パターン「Gyroid構造」をビジュアルで示しながら説明するといった使い方が可能だ。

また、Android StudioやGoogle AI Studioを通じて、開発者が3.5 Flashを直接利用できる環境も整っている。個人開発者や中小企業の技術担当者でも、フロンティアクラスのAIを手軽にプロジェクトに組み込めるようになった。

安全性と今後の展望

安全性と今後の展望

高性能なエージェント型AIには、相応の安全対策が不可欠だ。Google DeepMindは、3.5シリーズの開発にあたり「Frontier Safety Framework」に準拠した厳格な安全策を施している。

Frontier Safety Framework

サイバー攻撃やCBRN(化学・生物・放射性物質・核)関連の有害コンテンツ生成を防ぐセーフガードが強化された。同時に、安全なクエリを誤って拒否する「過剰拒否」の問題も改善されている。

このバランスは、新しい安全トレーニング手法と、AIの内部推論を応答前にチェックする解釈可能性ツールの導入によって実現された。モデルが「何を考えているか」を事前に把握し、問題があれば出力前に修正する仕組みだ。

3.5 Proの予告

Google DeepMindは、より大規模な「3.5 Pro」の開発も進めている。すでに社内で使用されており、翌月には公開される見込みだ。Flashの高速性を保ちつつ、さらに高度な推論能力を求めるユースケースに対応する位置づけとなる。

3.5シリーズ全体として、Googleは「エージェントファースト」の開発プラットフォーム戦略を加速させている。AIが単なるアシスタントから、自律的に行動する「デジタルワーカー」へと進化する過渡期にあることを示す重要な発表といえる。

この記事のポイント

  • Gemini 3.5 Flashはエージェント性能とコード生成でフロンティアクラスの成果を達成
  • 従来の旗艦モデルと同等以上の知能を4倍の速度で提供し、実用性が大幅に向上
  • Antigravityとの連携で複数エージェントの協調動作が可能になり、長期タスクの自動化が現実的に
  • ShopifyやSalesforceなど大手企業での導入がすでに始まっており、金融・会計分野でも活用が進む
  • 個人向けエージェントGemini Sparkや検索AIモードへの統合により、一般ユーザーの生活にも直接影響を与える
Google Universal Cart発表。AIが越境する新買い物体験と検索広告への波及

Google Universal Cart発表。AIが越境する新買い物体験と検索広告への波及

Googleは2026年5月のI/Oにおいて、新たなAI買い物かご「Universal Cart(ユニバーサルカート)」を発表した。検索、Gemini、YouTube、Gmail、そして提携小売店を横断し、ユーザーの購買行動をAIが継続的に支援する仕組みだ。単なる商品推薦を超え、価格監視や在庫確認、適合性チェック、決済補助までを自律的にこなす「代理型商取引(エージェンティックコマース)」への本格的な布石といえる。

この発表は、検索広告やEC事業に携わる企業にとって看過できない転換点を含んでいる。Googleが単なる情報の入り口から、商取引自体を内包するプラットフォームへと進化する過程で、広告の役割や商品データの重要性が根本的に変わるからだ。ここでは、Universal Cartの仕組み、基盤となるUniversal Commerce Protocol(UCP)、そして広告主やリテーラーへの影響を掘り下げる。

従来のGoogle検索ショッピング
ユーザーは検索結果から各ECサイトへ移動し、サイトごとにカートを作成・管理する。価格比較や再訪問はすべて手動で、購入の文脈は分断されていた。
Universal Cart導入後
GoogleのAIが横断的にカートを管理する。ユーザーがYouTube動画を見ている最中でも、Gmailのプロモーションメールからでも商品を追加でき、AIが価格下落や在庫復活を通知し、最適な購入タイミングを提案する。
※買い物かごがGoogleの各サービスを横断し、ユーザーの購買行動を継続的に支援するようになる。

Universal Cartがもたらす「永続する買い物体験」とは

Universal Cartがもたらす「永続する買い物体験」とは

Universal Cartの核心は、買い物かごを「その場限りの仮置き場」から「AIが能動的に管理する永続的な購買アシスタント」へと変える点にある。Search Engine Journalの記事によれば、Googleはこの機能を「ユーザーを追いかけるインテリジェントなショッピングカート」と表現しているという。

具体的には、ユーザーがGoogle検索で商品を調べ、Geminiとの対話で比較検討し、YouTubeのレビュー動画を見て、Gmailのクーポンを確認するといった一連の行動が、すべて単一のカートに集約される。裏側ではGeminiモデルが稼働し、価格変動や在庫状況、製品同士の互換性までを自動判定する仕組みだ。

AIが「待つ買い物」から「代行する買い物」へ変える

従来のオンラインショッピングでは、ユーザーが自ら価格を監視し、クーポンを探し、セールを待つ必要があった。Universal Cartはこれを反転させる。AIがユーザーに代わってバックグラウンドで価格下落を追跡し、ロイヤルティ特典の適用機会を探し、より適合性の高い代替商品を提案する。

Google Walletとの統合も発表されており、支払い方法やポイントプログラムの情報をAIが参照しながら、購入手続きの手間を減らす方向だ。Search Engine Journalの記事では、Nike、Sephora、Target、Walmart、Wayfair、そしてShopify加盟店などの大手小売業者が、この夏から決済機能の展開に参加すると報じられている。

STEP 1 ユーザーがGoogle検索で商品を探し、カートに追加
STEP 2 YouTube動画やGmailのクーポンからも同じカートに追加
STEP 3 Geminiモデルが価格下落・在庫・互換性を自動監視
STEP 4 最適なタイミングで通知し、Google Wallet経由で決済

カスタムPCのような複雑な買い物でも互換性を自動検証

Googleは、複数の小売店にまたがる部品で構成されるカスタムPCの購入においても、Universal Cartが部品間の互換性問題を決済前に検証できると説明している。これは単なるレコメンド機能の延長ではなく、購買判断そのものにAIが深く関与する設計であることを示している。

この能動性こそが、今回の発表の最大の特徴だ。Search Engine Journalの記事も「Googleがいかに積極的にUniversal Cartをリアクティブではなくプロアクティブなものとして位置づけているかが注目に値する」と指摘している。ユーザーが質問するのを待つのではなく、AIが先回りして提案する姿勢への転換である。

Universal Commerce Protocol(UCP)が切り拓く商取引インフラ

Universal Commerce Protocol(UCP)が切り拓く商取引インフラ

Universal Cartの裏側で動くのが、Googleが2026年初頭に発表したUniversal Commerce Protocol(UCP)だ。これは、異なる商取引システムやAIエージェントが共通言語でやり取りするためのインフラ層と位置づけられている。GoogleはI/Oで、すでに複数の小売業者やテクノロジーパートナーがUCPの採用を進めていることを明らかにした。

UCPの役割を簡単にたとえるなら、商取引の世界における「共通通貨」のようなものだ。これまでECサイトごとにバラバラだった商品情報や在庫データ、決済手段の記述方式を統一し、AIがサイトを越えてシームレスに買い物を支援できるようにする。

UCPの地理的・業種的拡大

I/OではUCPに関する以下の拡大計画も発表された。

  • UCP経由の決済機能がカナダとオーストラリアに拡大。英国も後日対応予定
  • 米国内でYouTubeにUCPが導入される
  • ホテル予約や地域のフードデリバリーなど、新たな商取引カテゴリへの展開を計画

特にYouTubeへのUCP導入は、動画コンテンツと商取引の結びつきを一段と強める動きとして重要だ。Search Engine Journalの記事も「YouTubeの拡大は際立っている」と評しており、ブランドにとってYouTubeを単なる認知チャネルではなく、ECチャネルとして捉え直す必要性が高まることを示唆している。

UCPがつなぐ商取引エコシステム
Google検索 Gemini AI YouTube Gmail 加盟ECサイト
すべてのチャネルがUCPを介して接続され、Universal CartとGoogle Walletが商取引のハブとなる。
検索・情報面 AIアシスタント 動画・エンタメ面 メール 外部加盟店

広告主にとってUCPが意味するもの

Search Engine Journalの記事は、UCPの拡大が広告主やリテーラーにとって「カートそのものよりも最終的に重要かもしれない」と指摘している。これは本質を突いた見方だ。Googleは商品の発見から購買行動、決済、AIエージェントまでを包含する商取引インフラを構築しつつある。

このインフラ上では、Merchant Centerの商品データ品質が従来以上に重要になる。AIが商品を理解し、推薦し、互換性を判断するための基盤データとなるからだ。構造化された商品情報の正確さが、AIによる露出機会を左右する時代に入りつつある。

広告主とEC事業者に迫る3つの変化

広告主とEC事業者に迫る3つの変化

Universal CartとUCPの登場は、広告主やEC事業者にとって以下の3つの変化をもたらす。

変化1、購買ジャーニーのGoogle内包化

これまでのGoogle検索は、商品情報を提供した後、ユーザーを小売店のサイトへ送り出す役割だった。Universal Cartはこの流れを逆転させ、比較検討や価格監視、再訪問、決済までをGoogleのエコシステム内に引き戻す。

Search Engine Journalの記事でも「歴史的にGoogle検索は主にユーザーを小売店サイトへ送り出していたが、Universal Cartはその活動の多くをGoogle内部に引き戻し始めている」と指摘されている。これは機会であると同時に課題でもある。Google内での露出を最大化できる事業者と、そうでない事業者の差が拡大する可能性が高い。

変化2、商品データがAI時代の新たな広告資産に

AIが能動的に商品を推薦し、価格下落を通知し、互換性を検証する世界では、商品データの質がそのまま販売機会に直結する。正確な在庫情報、詳細な製品スペック、競争力のある価格設定、ロイヤルティプログラムとの統合が、AIによる露出の前提条件となる。

これは従来のShoppingキャンペーンの最適化を超えた、より根源的なデータ戦略を求めている。Merchant Centerのフィード最適化は、もはや運用施策ではなく、AI時代の事業基盤そのものだ。

低品質な商品データ
スペック情報が不足し、在庫データが不正確な場合、AIはその商品を「信頼できない選択肢」と判断し、推薦対象から外す可能性が高い。
高品質な商品データ
詳細な製品情報、リアルタイム在庫、競争力ある価格、ロイヤルティ連携が整った商品は、AIが能動的に「最適な選択肢」としてユーザーに提示する。

変化3、YouTubeがECチャネルとして本格化

YouTubeへのUCP導入は、動画プラットフォームが商取引の場へと進化する決定的な一歩だ。商品レビュー動画を見ながらワンクリックでカートに追加し、そのまま購入まで至る体験が現実になる。

この変化は、ブランドのYouTube戦略にも影響を与える。認知獲得のための動画広告から、直接的な売上に結びつく商取引動画へのシフトが加速するだろう。Search Engine Journalの記事も「ブランドはYouTubeを単なる動画認知プラットフォームとしてではなく、ECチャネルとして考える必要性が高まる」と述べている。

計測とアトリビューションの再考が迫られる

計測とアトリビューションの再考が迫られる

Universal Cartが普及すれば、購買行動のより多くの部分がGoogleインターフェース内で完結する。これは広告の効果測定にも大きな影響を与える。従来のクリックベースのアトリビューションモデルでは、Google内で進む比較検討やAIによる価格監視の影響を捉えきれない。

Search Engine Journalの記事は「より多くのショッピング活動がGoogleインターフェース内で発生するようになれば、広告主はアトリビューションやアシストコンバージョン、クロスチャネルのカスタマージャーニーレポートの評価方法を再考する必要があるかもしれない」と指摘している。これは単なる技術的な課題ではなく、広告予算の配分やROI評価の根幹に関わる問題だ。

具体的には、以下のような再考が求められる。

  • ラストクリック至上主義からの脱却。AIが長期にわたって関与する購買ジャーニーでは、初期の商品発見や中期の価格監視が持つ価値を適切に評価する必要がある
  • Googleエコシステム内の複数タッチポイント(検索、YouTube、Gmail、Gemini)を横断した統合的な計測手法の確立
  • AIによるプロアクティブな提案(価格下落通知や互換性アラート)がコンバージョンに与える影響の定量化

代理型商取引の成熟と今後の展望

代理型商取引の成熟と今後の展望

Universal Cartはまだ初期段階にある。Search Engine Journalの記事も「より高度な代理型商取引機能の多くは成熟に時間がかかるだろう」と現実的な見方を示している。それでも、今回の発表はGoogleがショッピング領域でどこへ向かおうとしているのか、かなり明確な絵を示したといえる。

GoogleはAIによる商品発見の強化を超え、購買ジャーニーのより深い部分へと進出している。商品推薦やカート管理から、価格洞察、決済インフラに至るまで、購買プロセスの占有率を着実に高めているのだ。

広告主やリテーラーにとって、これは単に「広告の表示場所が変わる」という話ではない。ブランドが影響力を測定する方法、コンバージョンを帰属させる枠組み、購買ジャーニーの中で可視性を競う土俵そのものが変わる可能性を秘めている。

こうした変化に備えるには、以下の3点が当面の具体的なアクションとなるだろう。

  • Merchant Centerの商品データ品質を最優先で引き上げること。AIが商品を理解し推薦するための「原材料」はデータであり、その質が露出機会を決める
  • YouTubeをECチャネルとして位置づけ直し、商取引に直結する動画コンテンツ戦略を構築すること
  • アトリビューションモデルを再評価し、AIが介在する長期の購買ジャーニーを捉えられる計測基盤を整えること
代理型商取引へのロードマップ
現在 商品検索・比較のAI支援
2026年夏 Universal Cart + UCP決済が大手小売店で開始
今後 ホテル予約・フードデリバリー等へ拡大、完全な代理型購買へ

この記事のポイント

  • Universal Cartは検索・YouTube・Gmailを横断するAI駆動の永続的買い物かごであり、価格監視や互換性チェックまで自律的に実行する
  • 基盤となるUCPは商取引の共通言語として機能し、Googleエコシステム内外の決済や商品情報連携を支えるインフラである
  • 広告主には購買ジャーニーのGoogle内包化、商品データの戦略的重要性の高まり、YouTubeのECチャネル化という3つの変化が訪れる
  • AIが購買判断に深く関与する時代には、アトリビューションや効果測定の抜本的な再考が避けられない
Gemini 3.5 Flash がVercel AI Gatewayで利用可能に。並列処理能力と推論機能が大幅向上

Gemini 3.5 Flash がVercel AI Gatewayで利用可能に。並列処理能力と推論機能が大幅向上

Googleの最新モデル「Gemini 3.5 Flash」が2026年5月19日からVercel AI Gatewayで利用可能になった。このモデルはコーディング能力と並列エージェント実行ループの性能が大きく向上し、複雑なタスクでも高い推論精度を発揮する。

AI Gatewayの統合APIを通じて呼び出せ、使用量の追跡やコスト管理、リトライやフェイルオーバーの設定も標準で備わっている。開発者は面倒な基盤管理なしに、最新のAIモデルを本番環境へ素早く組み込める。

この記事では、Gemini 3.5 Flash の進化点、AI Gateway での具体的な使い方、実装時の注意点までを整理する。

Gemini 3.5 Flash の概要と新モデルの位置づけ

Gemini 3.5 Flash の概要と新モデルの位置づけ

Flash シリーズの進化

Gemini Flash シリーズは、Google が提供する軽量で応答速度に優れたAIモデル群だ。前世代のFlash 2.0と比べて、3.5 Flash では単なる速度向上にとどまらず、複数ステップのタスクを自律的に並列実行できるようになった点が大きな違いだ。

これにより、コーディングの効率化や、複数のAPIを同時に呼び出すようなエージェント型アプリケーションで強力なパフォーマンスを発揮する。

今回のアップデートで強化された点

  • コーディング補完の精度向上
  • 並列エージェント実行ループの大幅な最適化
  • コア推論能力と命令追従性の改善
  • マルチターン会話の一貫性向上
  • 思考モード(thinking mode)での高品質な推論トレースの生成

並列エージェント実行ループの進化

並列エージェント実行ループの進化

並列化によるパフォーマンス向上

従来のFlashモデルは、一連のタスクを逐次的に処理する傾向があった。たとえばコードリファクタリングの際に「API呼び出しAの完了を待ってからAPI呼び出しBを実行する」といった流れになる。これに対し、3.5 Flash は複数の独立した処理を同時に並列実行する能力が格段に上がっている。

並列実行のメリットは、応答待ち時間の大幅な短縮と、システム全体のスループット向上だ。特にマイクロサービス間の連携や、複数の外部データソースを一括で処理する場面で効果を発揮する。

従来の Flash モデル(逐次実行)
API呼び出し1 API呼び出し2 API呼び出し3
※順次実行のため全体の処理時間が長くなる
Gemini 3.5 Flash(並列エージェント実行)
API呼び出し1 API呼び出し2 API呼び出し3
※並列実行で待ち時間を大幅短縮、全体のレスポンスタイムが向上

この比較はあくまで概念図だが、実際のアプリケーションでは複数の独立した処理を同時に走らせることで、体感速度やスループットが大きく改善される。

thinking モードと推論トレースの強化

thinking モードと推論トレースの強化

thinking level の選択

Gemini 3.5 Flash はデフォルトで「medium」のthinking levelが設定されている。これは、応答の品質と生成速度、そしてコスト効率のバランスを取るための設計だ。より複雑な推論が必要な場合は high レベルに変更することも可能で、その場合は推論プロセスがより深く行われる。

たとえば、コードのリファクタリングや多段階の意思決定が必要なタスクでは、thinking level を high に設定することで、AIが問題をより細かく分解し、質の高い答えを導き出す。

マルチターンコヒーレンスと複雑タスク

3.5 Flash では、マルチターンの会話における一貫性も改善されている。以前のFlashモデルに比べて、前のやり取りを適切に保持しながら、矛盾のない回答を返す精度が向上している。これにより、長時間のコード生成や、会話型のエージェントアプリケーションでも安定した挙動が期待できる。

複雑なタスクでは「thinking traces(思考の痕跡)」がより詳細に出力されるため、モデルがどのような過程で結論に至ったかを検証しやすい。デバッグや品質管理の面で大きなメリットだ。

Vercel AI Gateway の機能とメリット

Vercel AI Gateway の機能とメリット

統合APIとプロバイダールーティング

Vercel AI Gatewayは、複数のAIプロバイダーを統一的なインターフェースで利用できるプラットフォームだ。開発者はプロバイダーごとに異なるAPIキー管理やエンドポイントを意識することなく、model の指定だけでモデルを切り替えられる。

さらに、AI Gatewayはインテリジェントなルーティング機能を備えており、特定のプロバイダーに障害が発生した場合に自動で別のモデルへフェイルオーバーしたり、リクエストをリトライしたりできる。これにより、単一プロバイダーを直接使うよりも可用性が向上する。

観測性とカスタムレポート

AI Gatewayには、使用量の追跡やコスト分析のためのカスタムレポート機能が組み込まれている。プロジェクトごと、環境ごとにAPI呼び出し回数やトークン消費量を可視化できるため、予算管理やボトルネックの発見に役立つ。

また、AI SDK Observability との連携により、モデルの応答時間やエラーレートを詳細に監視できる。Bring Your Own Key にも対応しており、自社で契約したAPIキーをAI Gateway経由で安全に利用できる点も企業ユースに適している。

AI SDK での実装方法と注意点

AI SDK での実装方法と注意点

コード例

AI SDK を用いて Gemini 3.5 Flash を呼び出すには、以下のように streamText 関数を使う。モデル名に google/gemini-3.5-flash を指定し、必要に応じて thinking level を設定する。

import { streamText } from 'ai';

const result = streamText({
  model: 'google/gemini-3.5-flash',
  prompt: 'Refactor this service to run API calls in parallel.',
  providerOptions: {
    google: {
      thinkingConfig: {
        thinkingLevel: 'high',
        includeThoughts: true,
      },
    },
  },
});

thinking level は 'medium'(デフォルト)と 'high' から選択でき、複雑なタスクでは 'high' を指定すると良い。なお、includeThoughts: true にすると推論過程のトレースもレスポンスに含められる。

サポート外のパラメータと制約

Gemini 3.5 Flash では temperaturetopPtopKthinking_budget といったパラメータはサポートされていない。以前のモデルでこれらの値を調整していた場合は、デフォルトの挙動に任せるか、他のモデルを検討する必要がある。

特に thinking_budget が使えない点は、推論にかかるコストを細かく制御したい場合に注意が必要だ。そのぶん thinking level の切り替えで大まかな品質とコストのバランスを取る設計になっている。

この記事のポイント

  • Gemini 3.5 Flash は並列エージェント実行ループの性能が大幅に向上し、コーディングや複数API呼び出しに強い
  • デフォルトで medium の thinking level を採用し、品質・速度・コストのバランスを最適化
  • Vercel AI Gateway によって統合API、リトライ、フェイルオーバー、観測機能をフル活用できる
  • temperature や topP などの一部パラメータは非対応のため、移行時には注意が必要
  • AI SDK 経由で数行のコードで導入可能、並列化のメリットをすぐに享受できる
AIが書き換えるローカル検索のルール、企業が今とるべき4つの対策

AIが書き換えるローカル検索のルール、企業が今とるべき4つの対策

AIによる検索体験の変化は、すでにローカルビジネスの集客構造を根本から変え始めている。GoogleのAI OverviewsやGemini、Ask MapsといったAI駆動型の検索機能が一般ユーザーの手に届いたことで、「検索結果の上位に表示されること」だけでは十分ではなくなったのだ。

2026年5月にMarTechが公開したSOCiとGoogleの共同ウェビナー予告記事では、この変化の本質が「AIがどのビジネス情報を信頼し、ユーザーに推奨するか」という新たな競争軸の出現にあると指摘されている。本記事では、この発表内容をベースに、具体的にどのような変化が起きているのか、そして企業は何をすべきかを4つの観点から掘り下げる。

AI Overviewsが変える情報の見せ方

AI Overviewsが変える情報の見せ方

従来の検索結果は、10件のリンクが並ぶリスト形式だった。ユーザーはその中からクリックしてサイトを訪れ、必要な情報を自分で探し出す必要があった。しかし、AI Overviewsの登場でこの体験は大きく変わった。検索結果画面の最上部にAIが生成した要約が表示され、ユーザーはクリックせずとも回答を得られるケースが増えている。

この変化がローカルビジネスに与える影響は極めて大きい。たとえば「東京 駅前 イタリアン ランチ 子連れ」という検索をした場合、従来であれば飲食店のリストが表示されていた。だが、現在ではAIが「子連れに優しいイタリアンレストランとして、A店、B店、C店が評価されています。A店はキッズメニューが充実しており、ベビーカー入店も可能です」といった要約を直接表示する。この要約に含まれなければ、そもそもユーザーの目に触れない時代になったのである。

従来の検索とAI Overviewsの比較

従来の検索(Before)
検索キーワード「駅前 イタリアン」
検索結果:10件のリンクリスト
※ユーザーは各サイトを訪れて情報を探す必要がある
AI Overviews 適用後(After)
検索キーワード「駅前 イタリアン」
AI要約「駅前エリアでは以下のイタリアンが評価されています。A店は子連れに最適で、B店はコスパが高いと評判です」
※AIが情報を統合し、要約内で推薦する
要約に含まれなければ、ユーザーの目に触れる機会が激減する。

つまり、表示順位を争う従来のSEO(検索エンジン最適化)から、AIに「紹介される」ための情報設計へと、勝負の場が移行しているのだ。

AI Overviewsに表示されるために必要なもの

AI Overviewsが参照する情報源は、Googleビジネスプロフィール(旧Googleマイビジネス)に登録された情報だけではない。ウェブ上の口コミ、公式サイトのコンテンツ、投稿された写真、第三者のレビューサイトの評価など、あらゆる情報がAIによって収集・統合され、要約生成の材料となる。

これは、ビジネス情報の「完全性」と「一貫性」が、かつてないほど重要になったことを意味する。営業時間、所在地、提供サービス、写真、口コミへの返信状況など、あらゆる接点で正確かつ最新の情報を提供し続けることが、AIからの信頼獲得につながる。

Ask Mapsと会話型検索のインパクト

Ask Mapsと会話型検索のインパクト

Googleマップに実装されたAsk Maps機能は、地図アプリの枠を超えたAIアシスタントだ。ユーザーは「このエリアでペット同伴OKのカフェは?」「明日の朝8時に開いているドラッグストアは?」といった自然な質問を投げかけることができる。AIは地図上のビジネスデータ、口コミ、営業時間などを解析し、条件に合致する店舗を即座に提示する。

この変化の本質は、検索の「キーワード入力」から「会話」への移行にある。従来の検索では「ペット カフェ 場所」といった断片的なキーワードをつなげていたが、今後は自然言語での質問が主流になる。AIが質問の意図を解釈し、最適なビジネスを選ぶため、商圏内の競合と比べて自社の情報がどれだけ豊かで、的確かを問われることになる。

Ask Mapsの情報処理フロー

① ユーザーの質問
「犬同伴OKでテラス席のあるカフェ」
② AIが複数のデータソースを解析
Googleビジネスプロフィール / 口コミ / 写真 / メニュー情報 / 公式サイト
③ 条件に合致するビジネスを提示
「Aカフェが条件に合います。テラス席があり、犬用の水皿も提供されています」
情報が不足しているビジネスは、条件判定の段階で除外されてしまう。

会話型検索がもたらす口コミの重要性

会話型検索では、ユーザーが求める具体的な条件にAIが答えるため、口コミの内容がこれまで以上に重要になる。たとえば「静かな環境で仕事ができるカフェ」という質問に対して、AIは口コミ内の「静か」「Wi-Fi完備」「コンセントあり」といったキーワードを拾い、推薦を行う。単なる星評価の高さだけでなく、テキスト情報として蓄積された具体的な評価が、AIの選択に直結する時代に入った。

口コミを増やすだけでなく、キーワードを含んだ具体的な口コミを促す施策が、今後のローカルSEOの中心になると見てよい。来店客に「どのような点が良かったか」を丁寧に尋ね、回答を促す仕組みづくりが鍵になる。

ビジネス情報の完全性がもたらす効果

ビジネス情報の完全性がもたらす効果

MarTechの記事によれば、SOCiとGoogleは「完全で正確なビジネス情報が、顧客とAIシステムの双方からブランドを理解してもらう助けになる」と述べている。ここでいう完全な情報とは、Googleビジネスプロフィールの全項目が埋まっていることにとどまらず、公式サイトの内容、投稿の頻度、写真の充実度、口コミへの反応速度までも含む概念だ。

ビジネス情報の全体像

コア情報
営業時間、住所、電話番号、カテゴリ選択
コンテンツ情報
写真、投稿、メニューやサービス一覧、Q&A
シグナル情報
口コミの数と内容、返信率、公式サイトの情報との一貫性
これらが統合され、AIに「信頼できるビジネス」と判断される
3層の情報がバラバラだとAIの評価が下がる。一貫性が最も重要。

情報の一貫性が信頼を生む

住所や電話番号の表記がGoogleビジネスプロフィールと公式サイトで異なっていたり、営業時間が最新でなかったりすると、AIはそのビジネス情報を「信頼性が低い」と判断する可能性がある。これは、人間のユーザーが情報の不一致に不安を感じるのと同じ理屈だ。AIは大量のデータを横断的に照合するため、人の目よりもはるかに厳密に矛盾を検出する。

具体的な対策としては、まずGoogleビジネスプロフィールの全項目を埋め、次に公式サイトの該当ページとの情報の一致を確認する。さらに、Yahoo!や食べログ、Rettyなど、国内の主要プラットフォームでも同一の情報を掲載することが望ましい。情報の「散らばり」をなくし、AIがどこを参照しても同じ情報にたどり着ける状態を目指したい。

実践的な最適化ロードマップ

実践的な最適化ロードマップ

では、実際に何から着手すべきか。AI時代のローカル検索対策は、従来のMEO(マップエンジン最適化)の延長ではない。情報設計の考え方を抜本的に見直す必要がある。以下に、優先度の高い4つの施策を整理した。

ステップ1:Googleビジネスプロフィールの完全最適化

カテゴリ選択、サービスメニュー、営業時間、写真、属性情報(バリアフリー対応や決済方法など)を完全に埋める。特に、カテゴリ選択はAIがビジネスの業態を理解するための最重要項目だ。メインカテゴリだけでなく、追加カテゴリも可能な限り設定する。写真は外観、内観、商品、スタッフの4種類を最低各5枚以上用意し、定期的な更新を行う。

ステップ2:口コミ戦略のシフト

星の数だけでなく、テキストの質を重視した口コミ施策に切り替える。来店時に「特に良かった点」を尋ね、回答内容をそのまま口コミに書いてもらえるよう自然に促す。AI検索では「店内が静か」「スタッフの対応が丁寧」「駐車場が広い」といった具体的な記述が、条件検索でのヒット率を左右する。

ステップ3:ローカルコンテンツの拡充

公式サイトやGoogleビジネスプロフィールの投稿機能を活用し、地域に根ざしたコンテンツを定期的に発信する。地元のイベント情報、季節限定メニュー、スタッフ紹介などが効果的だ。AIは鮮度の高い情報を評価する傾向があるため、少なくとも週1回の更新を維持したい。

ステップ4:データの一貫性監査

四半期に一度は、Googleビジネスプロフィール、公式サイト、主要ポータルサイト間で、住所、電話番号、営業時間、サービス内容に差異がないかを確認する監査を実施する。情報の不一致はAIの信頼を損なう最大の要因だ。手作業での確認が難しい場合は、ローカルSEOツールを活用した自動監査も検討したい。

この記事のポイント

  • AI OverviewsやAsk Mapsの普及で、検索の主役が「リンクリスト」から「AIによる要約と推薦」に移行している
  • 情報の完全性と一貫性がAIからの信頼獲得の鍵であり、営業時間や住所の不一致は致命的な評価ダウンにつながる
  • 口コミは星の数からテキストの質へと評価軸がシフトし、具体的な体験談がAIの選択に直結する
  • Googleビジネスプロフィールの完全最適化、口コミ戦略の見直し、ローカルコンテンツの定期更新、データ一貫性監査の4つが今すぐ取り組むべき施策だ