2026年5月21日

自社サイトのサーバーログから見るLLMO効果測定｜AIはどのようなページを読んでいるか

アナリスト小熊

2025年より「GEO / LLMO」という概念が、注目・提唱され始めています。
これは、ChatGPTやGoogle Gemini、Perplexityといった生成AIの普及によって、ユーザーが検索結果ではなく「AIの回答」を起点に情報を取得する行動が急速に広がっていることが背景に挙げられます。
GEO / LLMOとは、生成AIに対して理解され、引用されるための最適化施策を指す言葉です。
しかし、このGEO / LLMOには効果を測定する手段がほとんど存在しないことが課題として挙げられます。

従来のSEOであれば、検索クエリや流入キーワード、クリック数などのデータをもとに施策の成果を可視化することができました。一方で生成AIにおいては、ユーザーが入力したプロンプト情報や、どのWebサイトのどの箇所を参照して、回答を生成したのかといった情報を外部から取得することができません。
つまり、「どのコンテンツがAIに読まれ、どのように使われているか」は、ブラックボックスになっています。
本記事ではこの課題に対し、LLMOの効果測定の方法と自社サイトのサーバーログを分析した結果についてご紹介します。

GEO / LLMOにおける効果測定方法

冒頭で述べたように、GEO / LLMOにおいては、従来のSEOのような形で施策の効果を直接測定することはできません。
具体的には、以下の情報を外部から取得することは不可能です。

ユーザーが入力したプロンプト情報（生成AI内のログを外部から取得は不可能）
Webサイト内のどの箇所を参照し、回答に用いたか
生成AIがユーザーに対して送信した回答

ただし、以下3点の方法であれば、自社サイトにおけるGEO / LLMOの効果測定を間接的に行うことが可能です。

計測方法	分かること	メリット	デメリット / 限界	活用シーン
サーバーログ分析	・AIクローラーのアクセス状況・どのページが取得されているか・ページごとのヒット数 / 傾向	・ディレクトリ/ページ単位で分析可能・AIクローラー別のアクセス数と傾向分析	・CDN環境では取得できない場合あり・ユーザー行動は分からない・実際に引用されたかは不明	・AIに読まれているコンテンツの特定・コンテンツ戦略の見直し
GA4 参照元分析	・AI経由の流入（ChatGPT / Perplexity など）・ランディングページ・CV・ユーザー行動	・実ユーザーの行動が分かる・AI経由ユーザーのコンバージョン発生状況が分かる・既存ツールで実施可能	・AIとのチャット上でリンクの表示・クリックした場合のみ・リファラーが付かないケースあり（directなどに割り振られる）	・AI経由トラフィックの評価・ビジネス成果（CV）との紐付け
生成AI上の露出確認	・AI回答内での自社コンテンツの引用有無・回答の文脈・扱われ方	・ユーザー体験に最も近い・競合比較が可能	・再現性が低い（生成AIによる学習で回答が変わる）・調査クエリの数・種類によって工数がかかる・調査するクエリの選定の難易度が高い	・露出状況の確認・競合分析

この中で特にサーバーログに関しては、自社サイトにおいてどのページへ生成AIのクローラーが訪れているか特定が可能です。

サーバーログ分析でAIアクセスを可視化する仕組み

前章では、LLMOにおいてはAIの内部処理を直接観測できないため、間接的なデータから状況を把握する必要があると説明しました。
その中で最も有効な手段のひとつが、サーバーログの分析となります。

■ サーバーログとは

サーバーログとは、Webサイトに対するすべてのリクエスト（アクセス記録）を記録したデータです。
ユーザーがページを閲覧する際だけでなく、検索エンジンやAIなどのクローラーがページを取得する際にも、同様にログが記録されます。
サーバーログには以下のような情報が含まれています。

アクセスされたURL（どのページが取得されたか）
アクセス日時
User-Agent（どのクライアントからのアクセスか）
IPアドレス

■ AIアクセスの記録を特定する方法

生成AIは、回答を生成するための情報収集の過程で、Webサイトへアクセスします。
その際に、AIは、専用のクローラー（bot）を通じ、Webサイトへリクエストを送信します。
代表的なものとして、以下のようなUser-Agentが存在し、大きく分けて「学習用」「リアルタイム検索用」「ユーザーリクエスト時検索用」の3種類に分けられると考えられます。

AIサービス名	User-Agent	主な目的・役割
OpenAI (ChatGPT)	`GPTBot`	AIモデル（GPT-4等）の学習用データの収集
OpenAI (ChatGPT)	`OAI-SearchBot`	ChatGPT Searchなどの検索（RAG）
OpenAI (ChatGPT)	`ChatGPT-User`	ユーザーが対話中に指示した、リアルタイムなWebサイトの閲覧・要約のリクエスト実行用
Anthropic (Claude)	`ClaudeBot`	Claudeモデルの学習用データの収集
Anthropic (Claude)	`Claude-SearchBot`	ClaudeのWeb検索（RAG）
Google (Gemini)	`Google-Extended`	GeminiやAI Overviews（AIによる概要）の学習用データの収集
Google (Gemini)	`Google-CloudVertexBot`	Vertex AI Agent Builderなどで用いられるクローラー
Perplexity	`PerplexityBot`	AI検索エンジン「Perplexity」の回答生成、および学習用データの収集
Apple	`Applebot-Extended`	AppleのAI機能（Apple Intelligenceなど）の学習用データの収集
Common Crawl	`CCBot`	非営利団体による巨大なWebアーカイブ用クローラー

上記の通り、AIごとに異なるUser-Agentが存在するため、これらをもとにログを抽出することでAIによるアクセスを特定することが可能です。

自社サイトの分析結果

ここからは、実際に弊社ミツエーリンクスのサイトのサーバーログ（計測期間：2025年4月～2026年3月）を分析した結果をもとに、AIがどのようなページにアクセスしているかご紹介します。
本分析では、サーバーログからAIクローラーのアクセスを抽出し、以下の観点を整理しました。

どのディレクトリが参照されているか
全体アクセスに対するAIの割合
OpenAI クローラー別のアクセス傾向

AIベンダーの種類は利用者数を考慮して、ChatGPT（OpenAI）、Claude（Anthropic）、Bing/Copilot（Microsoft）の3つに絞って分析を行っています。

■ どのディレクトリが参照されているか

AIベンダー別にヒット数が多いディレクトリを比較すると、それぞれが重点的に取得している情報の種類に違いが見られました。以下に主な傾向を整理します。

AIベンダー	上位ディレクトリ	傾向分析	考察 / 示唆
OpenAI（ChatGPT）	・/knowledge/ ・/english/ ・/case/ ・/service/ ・/news/	ナレッジコンテンツへのアクセスが中心。特に他ベンダーと比較して英語ページへのアクセスが多い。	AIの主要な情報源はナレッジコンテンツである可能性が高い。また、英語ページの参照が多いことから、多言語対応（特に英語）が重要。日本語と英語で情報のズレがあると、AIの解釈に影響を与える可能性がある。
Anthropic（Claude）	・/knowledge/ ・/case/ ・/news/ ・/seminar/ ・/service/	ナレッジに加え、事例・サービスなど企業理解に関するページへのアクセスが多い。	Claudeは情報取得だけでなく、企業調査・比較検討用途で使われている可能性がある。サービスの強みや特徴、事例などの情報を明確に整理することが重要。「どんな会社か」をAIに正しく理解させるための情報設計が求められる。
Microsoft（Bing / Copilot）	・/search/ ・/knowledge/ ・/case/ ・/news/ ・/service/	サイト内検索ページへのアクセスが突出して多い。ナレッジや用語集も多く参照されている。	サイト内検索ページがAIに誤ってクロールされている可能性がある。不要ページ（検索結果など）のクロール制御が重要。 LLMOでは「見せるコンテンツ」だけでなく「見せない制御」も重要な施策と考えられる。

■ 全体アクセスに対するAIの割合

全体アクセスに対するAIアクセスの割合を確認すると、生成AIによるアクセスは特定のタイミングに限らず、継続的に発生していました。割合はおおよそ5%〜9%程度の範囲で推移しています。
AIは特定のタイミングでのみアクセスするのではないため、LLMO観点で、単発的な施策によって評価されるよりもAIに読み取られ続ける状態をいかに維持するかが重要なポイントと考えられます。

AIアクセス比率（月次推移）

2025年4月〜2026年3月における、全体アクセスに対するAIアクセスの割合を月次で整理したものです。

2025年4月（5.43%）

2025年5月（5.35%）

2025年6月（9.12%）

2025年7月（5.39%）

2025年8月（7.35%）

2025年9月（5.79%）

2025年10月（4.60%）

2025年11月（7.05%）

2025年12月（7.00%）

2026年1月（7.87%）

2026年2月（8.75%）

2026年3月（8.97%）

■ OpenAI クローラー別のアクセス傾向

OpenAI（ChatGPT）の場合、3種類のクローラーによるアクセスを確認しています。それぞれの用途および特徴についてまとめています。

OpenAIクローラー別の特徴と参照傾向

クローラー	年間ログ傾向	主な参照先	意味 / 示唆
ChatGPT-User（ユーザーからのリクエスト）	継続的に増加 ↗	・/knowledge/ ・/blog/ ・一部サービスページ	ユーザーによる実利用が拡大しており、ナレッジ系コンテンツが回答生成の情報源として利用されている可能性が高い。 Webサイト全体における情報の網羅性が重要事項
GPTBot（事前学習用）	減少傾向 ↘	・/knowledge/ ・sitemap系・/news/	学習・事前取得は「/news/」が入っていることから、一度学習したコンテンツが再度取得される可能性は低く、新規性・更新頻度の重要性が高い。
OpenAI（意図不明　※前述した一覧には当てはまらない）	変動あり ↕	・/service/ ・/case/ ・/company/	検索・補助処理・その他用途が混在している。ナレッジ以外のページも参照されており、構造全体の影響が大きい。

分析結果から見えたLLMO最適化のポイント

今回の分析から、AIはナレッジ系コンテンツを主要な情報源として参照しつつ、サービスページや事例ページも比較検討の材料として取得していることが分かりました。
そのため、LLMOでは単にナレッジコンテンツを増やすのではなく、AIが参照しやすい説明コンテンツを入口にしながら、サービス理解や企業理解につながる情報設計が重要になると考えられます。
コンテンツSEOにおける「トピッククラスター」と同じ考えで、ナレッジコンテンツはそのドメインにおいての専門性の強化につながるため、結果的にサービス推奨につながると考えられます。

AIが参照しやすい説明コンテンツを整備する：/knowledge/ のような情報整理型コンテンツを充実させる
サービス・事例ページの情報を明確にする：比較検討時に強みや実績が伝わるように整理する
Webサイトを多言語に対応する：OpenAIで /english/ へのアクセスが多く見られた。別言語のページを見ている背景は情報の正確性を確かめるためと考えられる
最新性・更新頻度を意識する：/news/ へのアクセスが多く見られた。最新の情報は情報の正確性の次に重要な指標と考えられる

また、GEO / LLMOを進めていく場合、SEOを継続して強化することが重要と考えています。SEO対策を行い、検索上位になるコンテンツは信頼度が高い情報と同義と考えています。
GEO / LLMOについては、弊社内のブログでまとめているためぜひご覧ください。（関連記事：「LLMO対策とは？具体的な対策方法や効果測定の方法を解説」）

サーバーログ分析における注意点

サーバーログ分析は、AIクローラーのアクセス状況を把握するうえで有効な手法ですが、情報が取得されていることと、実際に回答へ引用されていることは異なります。
サーバーログから分かるのは、あくまで「AIがページを取得した」という事実までであり、その後どのように使われたかまでは直接確認できません。

また、ログの取得環境によっては、AIアクセスを十分に把握できないケースもあります。
特にCDN（Cloudflare や Akamai など）を利用している場合、キャッシュ配信によってリクエストがオリジンサーバーまで到達せず、サーバーログに記録されないことがあります。
そのため、環境によってはオリジンサーバーのログだけでなく、CDNログやWAFログも含めて確認することが重要です。どのレイヤーでリクエストを観測できるかによって、見えるAIアクセスの量や種類も変わります。

サーバーログ分析はLLMOの実態を把握するための有効な観測手段ではあるものの、環境要件・ログ取得範囲・クローラー識別精度を踏まえて解釈することが前提となるため、もし本施策を進める場合は注意いただけると幸いです。

最後に

本記事では、GEO / LLMOにおける効果測定の考え方と、その具体的な手法のひとつとして、サーバーログを用いたAIアクセス分析の方法をご紹介しました。
従来のSEOと異なり、GEO / LLMOにおいては、検索クエリや参照箇所、回答内容を直接取得することができません。
そのため、サーバーログを確認することで、どのAIが、どのページを取得しているかを一定程度把握できることが分かりました。

今回の分析からは、AIごとに参照先や目的が異なること、特にナレッジコンテンツ・サービス情報における記入方法・多言語対応・構造設計が重要なポイントになることが見えてきました。
AIによる引用を狙うGEO / LLMOについては、ミツエーリンクスにてご支援可能です。詳しくは、サービスページをご確認ください。

前の記事 SEOだけでは不十分？AI時代の新しい検索最適化「AEO」「GEO」を解説

2026年の記事一覧に戻る

計測方法	分かること	メリット	デメリット / 限界	活用シーン
サーバーログ分析	・AIクローラーのアクセス状況・どのページが取得されているか・ページごとのヒット数 / 傾向	・ディレクトリ/ページ単位で分析可能・AIクローラー別のアクセス数と傾向分析	・CDN環境では取得できない場合あり・ユーザー行動は分からない・実際に引用されたかは不明	・AIに読まれているコンテンツの特定・コンテンツ戦略の見直し
GA4 参照元分析	・AI経由の流入（ChatGPT / Perplexity など）・ランディングページ・CV・ユーザー行動	・実ユーザーの行動が分かる・AI経由ユーザーのコンバージョン発生状況が分かる・既存ツールで実施可能	・AIとのチャット上でリンクの表示・クリックした場合のみ・リファラーが付かないケースあり（directなどに割り振られる）	・AI経由トラフィックの評価・ビジネス成果（CV）との紐付け
生成AI上の露出確認	・AI回答内での自社コンテンツの引用有無・回答の文脈・扱われ方	・ユーザー体験に最も近い・競合比較が可能	・再現性が低い（生成AIによる学習で回答が変わる）・調査クエリの数・種類によって工数がかかる・調査するクエリの選定の難易度が高い	・露出状況の確認・競合分析