今回は、グーグルのスニペットを、文書の日付からキーワード・イン・コンテキスト(Keywords in Context / KWIC)、省略記号、スニペット内のアンカーリンクに至るまで、すべて解剖してしまうつもりだ。
しかし、その前に、スニペットと言う用語を定義しておく。グーグルはスニペットをタイトルの後に続き、URLおよびキャッシュされたリンクを先行する「ウェブページの説明もしくは引用」と定義している。簡単に言うと、スニペットはグーグルの検索結果における説明の部分に当たる。タイトルとURLは含まれない。グーグルのエンジニア、マット・カッツ氏はスニペットおよび関連する事項の分かりやすい説明をこの動画の中で提供している。
細かいが、とても重要なポイントだ。スニペットはクエリごとに決まる。つまり、検索されたキーワードによって決まるのだ。この点は、ワードストリームのスニペットの管理に関するエントリで実証されている。
目次
まず、先頭にグレーのテキストの列が存在する。もし、グーグルがサイトがディスカションフォーラムだと特定した場合、以下の例のように、グレーのテキストで: “[数字] posts – [数字] authors – Last post: [日付]“が表示される:
これが学術的な記事だった場合、グレーのテキストは「by J Smith – 2010」もしくは「by J Smith – Cited by 1 – 関連する記事」のように変わる。本の結果の場合、「by J Smith – 2010 – フィクション – 333 ページ」のようになる。このページがマイクロフォーマットでマークアップされている場合、グレーのテキストは、人物、場所、出来事、製品評価/レビュー等に関する構造化データを表示する可能性がある。— グーグルはこのスニペットをリッチ・スニペットと呼んでいる。
リッチ・スニペットは比較的珍しく、マイクロフォーマットを利用すれば自動的にリッチ・スニペットが生成されると考えるべきではない。しかし、グーグルは継続的にリッチ・スニペットの実装を展開しているため、この傾向はやがて変わってくるのではないだろうか。今回のエントリでは、リッチ・スニペットについて深く議論するのではなく、コヴァリオの同僚であるジル・コッヘル氏がこの件について綴ったエントリを紹介しておく。
次に黒いテキストにスイッチする。スニペットが省略記号(”…”)を伴う日付を初めに記している場合がある。これは、ブログのエントリのように、グーグルが当該のページに関連する主要な日付があると判断した場合に発生する。しかし、ブログのカテゴリのページには当てはまらない。複数のエントリがリストアップされている可能性があり、それぞれに関連する日付があるためだ。
グーグルはページから巧みに日付を拾い出す。特別なマイクロフォーマットでマークアップされていなくても問題ない。実際に私は標準的なclass名を持ち、divやspanタグで囲まれた日付を見たことがある(例:class=”date”, class=”submitted”, class=”posthead”など)。また、dtタグで囲まれた“Post date”等のラベルを持ち、ddタグで囲まれた日付や単純に日付の前に“Last modified:”と言う単語が記載されているスニペットを見たこともある。さらに、コピー内で単純に裸の状態の日付も目にしたことがある。グーグルはこれらを正確に処理しているのだ。
日付がないものの、スニペットが省略記号で始まっている場合は、そのスニペットがより大きなテキストから抜粋され(メタディスクリプションもしくはページコピーの一部、後で再びこの件に触れる予定)、省略記号の前のテキストが省略されたことを示唆する。同様に、省略記号がスニペットの後ろにきている場合は、そのスニペットが切り取られたことを意味する。スニペットの長さは(少なくとも標準的なスニペットにおいては)、初めもしくは終わりの省略記号を省いて、最も長くて156文字である。スニペットのソース(例: メタディスクリプション)が156文字を超えている場合、スニペットは切り取られ、テキストが続くものの、スニペットのビューでは省略されている場所をマークするために省略記号が表示される。
省略記号は初めにくることもあれば、終わりにくることもある。また、中間にくることもあれば、数回記されることもある。加えて、この156文字ルールには例外がある。特定のリスティングに対して、156文字を超える長いスニペットが表示されることがあるのだ。例えば、クエリが難解な場合や、リスティングが検索結果の奥深くに埋まっている場合には、スニペットが通常の2行ではなく、3行から4行に及ぶため、文字数も倍近くに膨れ上がるのだ(上のスクリーンショットを参照)。
黒いテキストのコピーは単一もしくは複数のソースから取り込まれる。メタディスクリプションから、サイトのオープン・ディレクトリのリスティングに記載されているディスクリプションから、もしくは、これらの組み合わせから取り込まれる。事実、メタディスクリプションと本文のコピーが共にスニペットに組み込まれているのを私は見たことがある。
驚くことに、隠されているテキスト(”display:none”)でさえ、スニペットに表示されることもあるのだ。そこで、スニペットを成り行きに任せるのではなく、人気の高い検索用語をメタディスクリプションに含めることで、メタディスクリプションを使ってもらえるように、グーグルのアルゴリズムを“説得”するべきである(質が高いことが前提。つまり、しっかりした文で綴られており、クリックしたくなるような説得力のある記述がされていなければならない)。
恐らく、もともとページにユーザーの検索用語が見当たらない場合、ページが被リンクの本数やアンカーテキスト等により上位にランクインしている場合、メタディスクリプションが用いられることになっている可能性が高い。その点を踏まえて、アドバイスを贈る(当たり前のことだとは思うが)。サイトの分析を行い、ページにトラフィックをもたらしている上位の検索用語を調べ、これらの用語がページのメタディスクリプションに含まれていることを確認しよう。
メタディスクリプションは、自分で作成することに越したことはないが、大きなウェブサイトを持っているなら、あまり現実的ではない。幸いにも、メタディスクリプションは、レシピに基づき自動的に作成させることが出来る。しかも、自動とは言え、しっかりと役目を果たしてくれるのだ。例えば、Eコマースのシステムなら製品ページのメタディスクリプションを自動生成することが出来る場合が多いだろう。従って、ページ上に散らばる情報のすべての重要な部分(例えば価格、サイズ、スタイル、メーカー等)をまとめて表示してもらえる — 逆に言うと、グーグルが生成したスニペットがこれらの情報をすべて網羅してくれるとは限らない。
このグーグル・ウェブマスター・セントラル・ブログのエントリによると、メタディスクリプションは、グーグルの自動アルゴリズムが質が低いと見なした場合は利用される可能性が低くなるようだ。何がメタディスクリプションの質が低いとグーグルに判断させるのだろうか?例えば、キーワードの長い文字列、既にタイトルタグに記載されている情報と重複していたり、メタディスクリプション内で情報が重複していたり、もしくは、フォーマッティングが劣悪な場合、メタ・ディスクリプションが読みづらくなるのだ。
オープン・ディレクトリのリスティングを持っているなら、ホームページのメタディスクリプションおよびページのコピーは負けてしまうだろう。例えば、「starbucks」を検索すると、「International chain. Offers store locator, menu, and product information」と言う1行のスニペットが記されたスターバックスドットコムのホームページのリスティングが表示される。
これはオープン・ディレクトリのスターバックスに対するリスティングの記述である。スターバックスドットコムのホームページのメタディスクリプションには、検索用語(この場合は「starbucks」)が含まれ、ODPのディスクリプションには含まれていないものの、後者がスニペットに選ばれているのだ。ODPのリスティングをタイトルやスニペットのベースにしたくないのなら、ここで説明されているように、メタロボット NOODPタグを使おう。
黒いテキストの中に太字のキーワードが混ざっていることがある。太字の単語は、ユーザーが入力した検索キーワードに一致するものだ。太字は、グーグルのエンジニアによって、情報検索(RT)の専門用語で、文脈付き索引と呼ばれる(Key Word In Contextの頭文字をとってKWICと省略されることが多い)。マット・カッツ氏がKWIC(クイック)についてこの動画の中で説明している。
グーグルは、語幹、形態、同義語を介して、検索者のキーワードを文書内のキーワードに照らし合わせる。動名詞の違い(edの代わりにing)は、グーグルの関連アルゴリズムでは“マッチする”と見なされるが、KWICとして太字で表記される場合もあれば、されない場合もある。私の実験では、単数形のクエリに対しては複数形で太字のキーワードを返してきた(その反対もあった)。
黒いテキストの行の次に、“プラスボックス”が表示されることがある。プラスボックスは、例えば、株式を公開している会社のホームページのリスティングでは株価チャートに当たる。あるいは、グーグルがこのページから主要な住所を抽出することが出来た場合、関連するマップが表示されることもある。
サイトリンクも黒字のテキストの後に掲載される可能性がある。サイトリンクは、従来、スニペットの一部とは考えられていなかった。サイトリンクは、通常、アンカーテキストもしくはタイトルタグから得たテキストを使って、サイト内の別の場所に導く。しかし、現在、アンカーベースのサイトリンクも存在する。このタイプのサイトリンクは、同じページ内の場所に導く(#を含むリンクがページ上にある場合)。
サイトリンクは、スニペット自体の内側に表示されることもある(「Jump to」に関してはここで確認しよう)。アンカーベースのサイトリンクが、時折フォーラムに掲載されている点はとても奇妙である。この件に関しては、このエントリの後半で詳細を説明しているので目を通しておいてもらいたい。サイトリンクのすべてをこのエントリで語るのは不可能なので、またの機会に取っておこうと思う。とりあえずは、ニュージーランドで活躍する私の同僚が投稿したこのエントリを読み、サイトリンクを表示するグーグルの基準、そして、表示されるタイミングおよび仕組みに影響を与える方法を学んでもらいたい。
時折、スニペットのない検索結果に遭遇することがある。これはサイトがオフラインの場合やDDoS攻撃を受けている時などサイトを閲覧することが出来ない場合に発生する。ページがrobots.textによって無効扱いされているケースの方が多い。Disallowのディレクティブがあると、グーグルボットはこのページにアクセスしない。しかし、検索結果には掲載する — たとえそのページに何が記載されているのかが分からなくても。一方、非公式にグーグルにサポートされているNo-followのディレクティブは、検索結果から完全にページを除外する。
次にスニペットに関する幾つかの誤解を解いていこうと思う:
クリエイティブなスニペットを見てみたい。以下に、私が気に入っている、ダーレン・ラウズ氏のホームページのスニペットを紹介する(SEOmofo.com):
ラウズ氏と言えば、同氏が提供するスニペット・オプティマイザーツールを使って実践した、素晴らしいスニペットの実験をチェックしておいてもらいたい。次に、役に立つツールをもう一つ紹介しよう— グーグルが提供している — リッチ・スニペッツ・テスティング・ツールだ。ただし、リスティングにすぐにリッチ・スニペットが表示されると期待するのはよくない – しかし、当然ではあるがリンクトインやフルで大きなネットワークを持っているなら話は変わってくる。
この記事の中で述べられている意見はゲストライターの意見であり、必ずしもサーチ・エンジン・ランドを代表しているわけではない。
この記事は、Search Engine Landに掲載された「Anatomy Of A Google Snippet」を翻訳した内容です。
This article on Columns: 100% Organic – Search Engine Optimization Tips – first appeared on Search Engine Land.
© Copyright Third Door Media, Inc. Republished with Permission.
もう少し整理して話してほしかった気もしますが、なるほど、な点も多かった記事でした。しかしスニペット・オプティマイザーは初めて知りましたが、意外と使えるかもですね(日本語も大丈夫です)。この検索結果にも驚きました!しかし「World’s Greatest SEO」とは強気ですね。。。半分シャレだとしても日本だったら叩かれそう。。。 — SEO Japan
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。