AIに選ばれるコンテンツの条件とは?ChatGPTの引用元分析から見えたSEOの新常識

AIに選ばれるコンテンツの条件とは?ChatGPTの引用元分析から見えたSEOの新常識

AIに選ばれるコンテンツの条件とは?ChatGPTの引用元分析から見えたSEOの新常識

ChatGPTなどの生成AIが回答の根拠としてどのウェブサイトを引用するかは、もはや偶然の産物ではない。最新の調査によれば、特定のトピックにおいて引用されるドメインの約67%は、わずか30個程度の主要サイトに集中しているという実態が明らかになった。

このデータは、120万件に及ぶChatGPTの回答を分析した結果に基づくものだ。従来のGoogle検索におけるSEO(検索エンジン最適化)とは異なる、AI時代の情報収集アルゴリズムが透けて見える内容となっている。

検索の主役が従来のリスト形式からAIによる要約へと移り変わる中で、自社のコンテンツがAIに「信頼できるソース」として選ばれるための条件を理解することは、今後のWebマーケティングにおいて死活問題となるだろう。本記事では、AIがソースを選ぶ基準とその背後にある「科学」について詳しく解説していく。

AIに選ばれるドメインの法則:上位30サイトがシェアの67%を独占

AIに選ばれるドメインの法則:上位30サイトがシェアの67%を独占

従来のGoogle検索は「勝者総取り」のゲームと言われてきた。検索結果の1位がクリックの大部分をさらっていくからだ。ChatGPTのようなAIの回答においても、この傾向はさらに極端な形で現れている。特定のトピックについて、わずか30のドメインが引用全体の3分の2を占めているという事実は、AIが参照する「信頼の枠」が非常に狭いことを示唆している。

業界ごとに異なる「独占率」の実態

記事によれば、この引用の集中度は業界(バーティカル)によって大きく異なる。例えば「教育」分野は非常に独占が進んでおり、上位10%のドメインが引用全体の約60%を占めている。これは、教育コンテンツにおいては特定の公的機関や大規模な専門サイトが圧倒的な信頼を得ているためだと考えられる。

一方で「ヘルスケア(医療)」分野は、引用が数百のドメインに分散している。医療情報は多岐にわたり、特定の症状や法規制、アプリの活用など、ニッチな領域ごとに異なる専門サイトが引用されるためだ。これは、新しく参入するサイトにとってもAIに引用されるチャンスが残されている「開かれた市場」であることを意味している。

「網羅性」がドメイン権威性を上回る瞬間

興味深いのは、単にドメイン全体の評価が高い(ドメイン権威性が強い)サイトが選ばれるわけではないという点だ。著者のケビン・インディグ氏は、特定の1ページが100種類以上の異なる質問(プロンプト)に対して引用されている事例を挙げている。これは、AIが「サイト全体」よりも「そのページがどれだけ多くの関連する問いに答えているか」を重視している証拠だ。

たとえ有名な大企業のサイトであっても、情報が断片的であればAIには選ばれにくい。逆に、1つのページで「とは何か」「選び方」「価格」「比較」といったトピックを網羅しているページは、AIにとって効率的な情報源となり、多くの引用を獲得することになる。

引用獲得の鍵は「文字数」にあり?1万文字の壁と業界別の最適解

引用獲得の鍵は「文字数」にあり?1万文字の壁と業界別の最適解

SEOの世界では長らく「コンテンツの長さと順位の相関」が議論されてきたが、AIによる引用においても文字数は重要な指標となる。分析結果によると、ページのテキスト量が増えるほど引用される確率は高まり、特に5,000文字から10,000文字(英語圏のデータでは文字数ベース)のレンジで引用率が急増する傾向が見られた。

1万文字を超えると引用率が2倍に跳ね上がる理由

調査データでは、20,000文字(キャラクター数)を超えるページは、500文字未満のページに比べて約4倍の引用を獲得している。これは、AIが複雑な回答を生成する際に、詳細なデータや背景知識が含まれている「厚みのあるコンテンツ」を好んで参照するためだ。LLM(大規模言語モデル)は、文脈を理解するために十分な情報を必要とするため、情報密度の低い薄いコンテンツは無視される傾向にある。

金融やSaaSで見られる「例外」のページ構成

ただし、文字数が多ければ良いというわけではない。業界によっては「短く、正確な情報」が好まれるケースもある。例えば「金融」分野では、10,000文字を超えるような長大な記事よりも、5,000文字程度のコンパクトな記事の方が引用率が高いという逆転現象が起きている。

金融情報の読者は、具体的な利率や規制の要約、比較表などの「即座に使えるデータ」を求めている。AIもそれを理解しており、冗長な解説よりも、データが整理された信頼性の高い要約ページを優先して引用する傾向がある。自分のターゲットとする業界が「網羅的な解説」を求めているのか、それとも「正確なデータの提示」を求めているのかを見極める必要がある。

1枚のページで複数の問いに答える「エバーグリーン戦略」

1枚のページで複数の問いに答える「エバーグリーン戦略」

AI検索における戦略として、著者は「引用の広さ(Breadth)」という概念を提唱している。これは、1つのURLがどれだけ多様な質問に対して引用されたかを示す指標だ。多くのサイトが特定の1つの質問にしか答えられない「使い捨ての回答源」になっている一方で、少数の「エバーグリーン(常緑)なページ」が圧倒的な引用数を稼いでいる。

引用URLの約6割は「一度きり」の使い捨て

分析によると、AIに引用されたURLの約67%は、わずか1種類のプロンプトに対してしか表示されていない。つまり、ほとんどのページは特定のニッチな問いに対する「一発屋」で終わっている。これでは、AI検索からの継続的なトラフィックは期待できない。

複数の意図をカバーする比較・ガイド記事の価値

上位5%に食い込む「エバーグリーンなページ」には共通の構造がある。それは、「2025年最新版:〇〇ツールの比較」といったカテゴリーレベルのガイド形式だ。こうしたページは、「〇〇とは何か」「おすすめはどれか」「価格はいくらか」といった、ユーザーが抱く一連の疑問(クエリクラス)をすべて1ページで解決できるように設計されている。

AIは、複数のソースを行ったり来たりするよりも、1つの信頼できるページから複数の情報を抽出することを好む。そのため、1キーワードに対して1ページを作る従来の「スモールワード狙い」のSEOよりも、トピック全体を構造的に網羅する「トピック・オーソリティ(トピックの権威性)」を意識したページ作りが、AI時代には高い投資対効果(ROI)を生むことになる。

AIが最も注目するのは「ページ冒頭の30%」である

AIが最も注目するのは「ページ冒頭の30%」である

AIがページを「読む」際、すべての箇所を平等に扱っているわけではない。分析の結果、ChatGPTが引用する情報の約44%は、ページの最初の30%の範囲から抽出されていることが分かった。特に、冒頭10〜20%のエリアは「黄金地帯」と呼ばれ、最も高い引用密度を誇っている。

導入文直後の「10-20%」のエリアが黄金地帯

なぜページの最初の方が引用されやすいのか。それは、多くのWebサイトが冒頭に「結論」や「重要な定義」「最新の統計データ」を配置しているからだ。AIは効率を重視するため、ページの深い階層まで読み進める前に、必要な情報を冒頭で見つけようとする。特に金融などのデータ重視の分野では、この「フロントロード(情報を前倒しにする)」傾向が顕著だ。

結論やまとめが引用されにくいという事実

一方で、ページの最後にある「まとめ」や「結論」セクションは、AIにほとんど無視されている。ページの末尾10%から引用される割合は、わずか2.4〜4.4%に過ぎない。人間にとっては親切な「まとめ」も、AIにとっては既出情報の繰り返しに過ぎず、新たな情報のソースとしては価値が低いと判断されている可能性がある。

AIに引用されたいのであれば、重要な主張や独自のデータ、具体的な数値は出し惜しみせず、ページのなるべく早い段階で提示すべきだ。導入文のすぐ後に、その記事の核心となる情報を配置する構成が、AI時代のスタンダードになるだろう。

これからのAI検索最適化(GEO)に向けた独自の考察

これからのAI検索最適化(GEO)に向けた独自の考察

今回の調査結果を踏まえると、今後のSEOは「GEO(Generative Engine Optimization / 生成エンジン最適化)」という新しいフェーズに移行していく。これまでのSEOが「検索結果の10個の青いリンクの中にどう入るか」を競っていたのに対し、GEOは「AIの回答の一部としてどう採用されるか」を競うゲームだ。

「1キーワード1ページ」からの脱却

従来の「1つのキーワードに対して1つのページを作る」という手法は、AI検索においては非効率になる可能性がある。AIは散らばった情報を収集するよりも、1つの高密度なソースを好むからだ。これからは、関連する複数のキーワードを包含した、構造的で情報量の多い「ピラーページ(柱となるページ)」の重要性がさらに増すだろう。

構造化データを超えた「情報の密度」の重要性

技術的な側面では、Schema.orgなどの構造化データの実装は引き続き重要だが、それ以上に「テキストそのものの情報密度」が問われるようになる。Jaccard係数(集合の類似度を測る指標)を用いた分析でも、AIはページ内の特定の「情報の塊(チャンク)」を狙い撃ちして引用していることが示されている。つまり、曖昧な表現を避け、AIが抽出しやすい明確な事実とデータの記述が、引用獲得の強力な武器になるのだ。

この記事のポイント

  • AIの引用は特定のドメインに集中しており、上位30サイトがシェアの67%を占めている。
  • 文字数が多いほど引用されやすい傾向にあるが、金融など業界によっては5,000文字程度の「密度」が重視される。
  • 1つのページで複数の問いに答える「網羅的なガイド形式」が、AI検索において高い投資対効果を発揮する。
  • AIはページの冒頭30%(特に10-20%付近)を最も重点的に読み、末尾の「まとめ」はほぼ無視する。
  • これからのSEOは、断片的なページ作成から、トピック全体を網羅する「トピック・オーソリティ」の構築へとシフトすべきだ。

出典

  • Search Engine Journal「The Science Of How AI Picks Its Sources」(2026年3月24日)
海田 洋祐

・ 複数業界における17年間のデジタルビジネス開発経験 ・ ウェブサイト開発のためのHTML、PHP、CSS、Java等の実用的知識 ・ 15ヶ国語対応の多言語SaaSの開発経験 ・ 17年間にも及ぶ、Eコマース長期運営経験 ・ 幅広い業界でのSEO最適化の豊富な経験

メッセージを残す