AIに引用されるページは、ウェブ上で最も権威のあるページではない。特定のトピックに絞り込まれ、自然な言葉で書かれたページだ。数百万件の検索クエリ、プロンプト、ウェブページを分析した2つの新たな研究が、同じ結論に達した。AI検索では、従来の権威性を示すシグナルよりも、まさに尋ねられた質問に答えていることのほうが重要なのだ。
この発見は、経営層がコンテンツ戦略やAI検索への投資、さらに「ChatGPTで上位表示させる」とうたう新たなベンダー群をどう考えるべきかに、大きな意味を持つ。
AI検索は、Google検索の「川下」にある
これらの研究から得られる、最も実務的に有用な知見は、ChatGPTをはじめとするAI検索サービスが、従来型検索と並走する別系統のシステムではないということだ。並走していないのだから、別系統の戦略を立てる必要もない。研究が示すとおり、これらのプラットフォームは従来型検索の「川下」で動いている。グーグル検索の上位に表示されているページは、同じクエリに対するChatGPTの検索対象リストでも、ほぼ確実に上位に入っている。
・川上:グーグルなど従来型検索。ウェブをインデックス化し、ランキングという素材を生み出す
・川下:ChatGPTなどのAI検索。川上が生んだ素材を基に、ユーザー向けの回答という完成品を作る
AirOpsが35万4000ページを対象に実施した調査は、この点を具体的に示している。
・検索結果の1位に表示されているページは、58%の確率で引用された
・10位まで下がると、引用率は14%にまで低下する
・複数回のクエリ実行を通じて安定して引用されたページは、検索結果での順位の中央値が2.5位だった
・1度も引用されなかったページは、順位の中央値が13位だった
AhrefsがChatGPTへのプロンプト140万件を分析した調査も、この傾向をさらに裏付けている。引用されたURLのうち88%は、一般的なウェブ検索インデックスに由来するものだった。
これらの研究が示しているのは、ChatGPTがReddit、Wikipedia、その他の大手サイトを参照しながらトピックを理解し、文脈を組み立てた上で、引用元としては多くの場合別のページを示すという構図だ。ChatGPTは大手の集合知から学びつつ、引用元として名前を出すのは別の専門サイトなのである。
「トピック」を語るな、「質問」に答えよ
あるページが検索結果に入る段階まで来ると、最終的な決め手になるのは、その内容が実際に尋ねられている具体的な質問とどれほど正確に合っているかである。この段階での違いは単純だ。インターネットが長年よりどころにしてきた「Auto repair near me(近くの自動車修理)」や「Med spa in Los Angeles(ロサンゼルスのメディカルスパ)」といった従来型のキーワード検索は、現在では、はるかに多くの意味情報を含む自然文の検索クエリとして入力されるようになっている。AI回答エンジンは、それぞれのクエリについて複数の下位クエリを生成する。この処理は「クエリ ファンアウト」(Query Fan-out)と呼ばれ、AIはその1つ1つに直接答えるページを探す。
Ahrefsのデータによると、引用されたページは、引用されなかったページに比べ、AI内部で生成された下位質問との意味的な類似度が明らかに高かった。AirOpsのデータも同じ傾向を示している。見出しがユーザーの質問に近く一致しているページは41%の確率で引用されたのに対し、一致度が弱いページでは30%にとどまった。ユーザーの自然文クエリとの意味的な一致がほとんど、またはまったくないページでは、引用率はさらに低かった。



