この記事は、2025年 4月 17日に Search Engine Journal で公開された Roger Montti氏の 「Google Says LLMs.Txt Comparable To Keywords Meta Tag」 を翻訳したものです。SEO上級者は、ぜひこの記事のソース元となっているRedditのこちらのスレッドをブラウザ翻訳などでご確認いただくことを推奨します。
Googleのジョン・ミューラー氏は、LLMs.txtがどのように役立つかについて、キーワードメタタグと比較し、現実的な評価を示しました。
Googleのジョン・ミューラー氏は、ウェブサイトのコンテンツをAIエージェントやクローラーに表示するための標準案であるLLMs.txtに関する質問に答え、その有用性を過小評価しました。さらに、LLMs.txtの使用が無意味である理由を、役に立たないキーワードメタタグと比較して説明しました。
LLMs.txtは、大規模言語モデル用の「robots.txt」とよく比較されますが、これは誤解です。robots.txtの主な目的は、ボットによるウェブサイトのクロールを制御することです。対して、LLMs.txtはボットの制御を目的としていません。そのため、LLMs.txtとrobots.txtを比較するのは適切ではありません。
LLMs.txtの提案は、AIにMarkdown形式のテキストファイルを使ってコンテンツを表示させ、広告やサイトナビゲーションを排除し、ウェブページのメインコンテンツだけを閲覧可能にすることです。Markdown言語は人間と機械の両方が理解できる形式で、見出しは「#」、リストは「-」で示します。LLMs.txtはこの機能に似たものを備えていますが、それ以外の機能は提供していません。
最後のポイントは、Googleのジョン・ミューラー氏の発言と関連があり重要です。
Reddit(アメリカの巨大掲示板型ソーシャルメディア:ユーザーが投稿したコンテンツに対して投票できる記事、質問、意見交換などのコミュニティサイト)でLLMs.txtに関する議論が始まり、AIボットがLLMs.txtファイルをチェックしていないという経験が他のユーザーによって共有されました。
あるユーザーは次のように書いています。
「今月初めにブログのルートにLLMs.txtファイルを送信したのですが、クロールログにはまだ影響が見られません。トラッキングシステムを導入されている方や、導入後に何か変化があった方はいらっしゃいますか? まだ実装していない場合は、ご意見をお聞かせください。」
そのユーザーは、20,000 以上のドメインをホストしており、AI エージェントやボットは LLMs.txt ファイルをダウンロードしておらず、BuiltWith のようなニッチなボットのみがそれらのファイルを取得していると話していました。
「現在約2万のドメインをホストしています。一部のニッチなユーザーエージェントを除いて、ボットがこれらのドメインを取得していないことは確認済みです」
ジョン・ミューラー氏はこう答えました:
「私の知る限り、どのAIサービスもLLMs.txtを使用しているとは言っていません(サーバーログを見れば、チェックすらしていないことがわかります)。私にとって、これはキーワードメタタグに相当するものです。サイト所有者が自分のサイトについて主張する内容です…(本当にそのサイトがLLMs.txtを使用しているのでしょうか? まあ、確認すればいいでしょう。その時点で、サイトを直接確認すればいいのではないでしょうか?)」
彼の言う通り、Anthropic、OpenAI、Googleといった主要なAIサービスは、提案されたLLMs.txt標準へのサポートを表明していません。しかし、もし実際に誰も使っていないのであれば、その存在に何の意味があるのでしょう?
ミューラー氏はまた、LLMs.txtファイルが冗長であると指摘しています。
なぜなら、元のコンテンツ(および構造化データ)が既にダウンロードされているのであれば、わざわざMarkdownファイルを使う理由がないからです。LLMs.txtを使用するボットは、他のコンテンツがスパムでないことを確認する必要があるため、わざわざLLMs.txtを使う意味がないのです。
最後にもうひとつ。パブリッシャーやSEO担当者がLLMs.txt内のコンテンツをAIエージェントにスパムとして送信し、別のコンテンツをユーザーや検索エンジンに表示することを防ぐ方法があるのでしょうか?この方法では、LLMをクローキングすることと同義で、スパムを生成するのは非常に簡単です。
その点では、これは検索エンジンが使用しないキーワードメタタグと非常によく似ています。サイトが本当にそのキーワードに関するものであると信頼するのはあまりにも不確実であり、最近の検索エンジンはコンテンツを解析してその内容を理解する点でより優れ、洗練されています。
Redditへの投稿を開始したシモーネ・デ・パルマ氏は、LinkedInにLLMs.txtに関する議論を投稿しました。デ・パルマ氏は自身の経験に基づき、LLMs.txtがユーザーエクスペリエンスを低下させる可能性があると説明しました。
彼は次のように書いています
「LLMs.txtファイルはハッシュタグ#AIサービスによって無視されているようで、ウェブサイトの所有者にとって実質的なメリットはほとんど、またはまったくありません。
さらに、LLMs.txtファイルは元のURLにリンクバックしないため、ユーザー体験低下につながると主張する人もいます。ウェブサイトで引用を獲得すると、ユーザーを適切なウェブページではなく、途方もないテキストの羅列に誘導してしまう可能性があります。では、そもそもLLMs.txtファイルの意味は何でしょう?」
議論に参加した他の参加者も同意しました。ある回答者は、ファイルへのアクセスが少なかったと述べ、業務のリソースは他に集中させた方が良いという意見を述べました。
その回答者はこう語っています
「同感です。私が実施しているテストでは、アクセス数も少なく、今のところメリットも見られません(別の方法で活用すれば、さまざまなクローラーを混乱させるリスクもあるため、有効活用できる可能性がありますが)。現時点では、適切に構築された構造化データ、robots.txt、そして各種サイトマップに注力する方が生産的です。」
上記Reddit の原文はこちらをご確認ください:LLM.txt – 私たちはどこにいるのでしょうか?
SEO Japan編集部より:現時点では「無視される可能性の高い、形だけの仕様」という扱いで、Googleとしても“実装したからといって効果があるとは限らない”というスタンス。OpenAIやAnthropicなど主要な生成AI企業側も対応を明言しているわけではなく、「企業側が出力を制御したい気持ちは理解できるが、果たしてそれが成立するかは別問題」といった空気感が漂っています。
SEOにおけるrobots.txtと異なり、LLMs.txtはあくまで“提案レベルの意思表示”にすぎず、今後のAIモデルとWebの関係性がどうなるのかを見極める上での一つの材料と捉えておくのが現実的でしょう。
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。