リンクベースのランキングシステムにおいては、すべてのリンクが等しいわけではなく、検索エンジンは、ページにそれぞれのリンクの重要度を伝える仕組みを特定するため、様々な要素を見ている可能性がある。
グーグルがウェブページを格付けする際に利用するシグナルの一つが、リンク先とリンク元である。他のウェブサイトにリンクを張られているページを特定するためだ。“重要”なページからのリンクはあまり重要ではないページからのリンクよりも重要視される。このシステムにおける重要なページとは、他の重要なページから、もしくは重要ではない多数のページから、もしくはその両方からリンクが張られているページのことを指す。このシグナルはページランクと呼ばれ、グーグルがウェブページを格付けし、検索者からのクエリに応じて検索結果のページに表示する位置を決めるために利用する数多くのシグナルの一つである。
グーグルのファウンダーが初期に綴った論文、
「大規模なハイパーテキストに基づくウェブ検索エンジン」によると :
ページランクは、ユーザーの行動のモデルとして考えることが出来る。グーグルは、ウェブページを与えられると、“戻る”ボタンを押さずにリンクをクリックし続けるものの、やがて飽きて別のランダムなページで同じことをする“ランダムサーファー”が存在すると仮定している。ランダムサーファーがページを訪問する可能性がそのページのページランクである。
このアプローチの下では、同じページのリンクは別のページに向かう場合、どれも同じ重要度を持つことになる。
2004年に申請され、最近承認されたグーグルの特許は、リンクが同じページに表示されている際のリンクの持つ価値に対して、少し異なるアプローチを採用している:
発明の原則に沿ったシステムおよびメソッドは、サーファーが一連のリンクを介して文書にアクセスした際に、サーファーがリンクの幾つかをそれ以外のリンクよりも高い確率でクリックすることを示唆するリーズナブルサーファーモデルを特定することが出来る。
このリーズナブルサーファーモデルは、文書に関連するリンクのすべてが同じ確率でクリックされるとは限らない点を反映する。「利用規約」のリンク、バナー広告、そして、文書に関係のないリンクはクリックされる確率が低いリンクの例として挙げることが出来る。
特許:
ユーザーの行動および/または特徴的なデータを基にした文書のランクづけ
発明者 ジェフリー A. ディーン、コリン・アンダーソン、アレクシス・バトル
グーグル Inc.に委託
米国特許 7,716,225
付与日: 2010年5月11日
申請日: 2004年6月17日
抜粋
リンクが掲載された文書からのリンクの異なる特徴に関連するデータ、そして、リンクに関連するナビゲーションの行動に関するユーザーの行動のデータをベースにしたモデルを生成するシステム。また、このシステムは、モデルをベースに文書を格付けする。
この“リーズナブルサーファー”モデルでは、ページに表示されるすべてのリンクが同じ価値を持っているわけではないことを意味している。リンクに関連する別の特徴、そして、リンクが表示されるページおよび導くページによって、これらのリンクがリンク先のページに与える価値の大きさが決まる。
この特許では、検索エンジンがウェブのページをクロールし、インデックスするとき、検索エンジンは、リンクが表示されるソースページ、リンクが導くターゲットページ、そして、当該のリンク自体に関連する特徴に注目し、これらのページのランクを決める上で役立つモデルを生成する。また、検索エンジンは、例えばどのリンクをクリックしたのか、ページを見つけるためにどんなクエリを利用したか、さらにウェブブラウザもしくはツールバー等のブラウザのアドオンから得られるその他の情報等、ビジターがページをどのように利用しているかに関する情報を集めることもあり得る。
以下のリストに特徴の例を掲載する。すべての特徴が利用されるわけではなく、また、リストアップされていない特徴が用いられる可能性もある点を留意してもらいたい。
リンクに関連する特徴:
ソースの文書に関連する特徴の例を以下に挙げていく:
ターゲットの文書に関連する特徴の例を以下に挙げていく:
文書およびリンクに関連するユーザーの行動のデータもまた以下のように考慮される可能性がある:
このようなユーザーの行動のデータは、ウェブブラウザもしくはグーグルのツールバーのようなブラウザのアシスタントプログラムから入手することが出来るだろう。
このモデルがベースとする特徴は、ページのリンクが、このような特徴のポジティブおよびネガティブな局面によって選択される可能性を特定する意図を持つ。
例えば、特定のサイズよりも大きなアンカーテキストを持つリンクは、小さなサイズのアンカーテキストを持つリンクよりも選択される可能性が高いだろう。ページの上部に近いリンクもまたクリックされる可能性が高いだろう。文書のトピックがリンクが表示されているページのトピックに関連している場合もまた、そのページのビジターに選ばれる可能性は高い。そのため、大きなフォントで、ページの上部に近く、同様のトピックを取り上げるページに導くリンクは、フォントが小さく、ページの底部に近い、関連性のないトピックのページに導くリンクよりも遥かにクリックされる可能性は高いだろう。
この特許は、ページの異なるリンクがビジターによって選択され、クリックされる可能性を特定するために、異なる特徴に適用されるその他のルールの例を提供している。この可能性は、それぞれのリンクの動的な重要度を特定するために用いられ、リンクが導くページのランキングの高さに影響を与える可能性がある。リンクに対する異なる重要度によって、それぞれのリンクが他のサイトにもたらすページランクが決まってくるかもしれないのだ。
もしくは、特許に記載されているように:
文書のランクは、リーズナブルサーファーが多数のリンクを辿った後に文書にアクセスする可能性として解釈される。
ページランクのようなリンクベースのシステムでは、ページのリンクはどの程度の価値をもたらすのだろうか?
本日承認されたこの特許の下では、リンクの価値は、リンクがページのどこに位置しているのか、リンクは他のリンクと異なるフォントや色を使っているか、リンクのアンカーテキストは何ワードあるか、使われているテキストは営利目的か、リンクが掲載されているページのトピックは何か、リンクが導くページのコピーは何か等、多数のファクターによって異なる。
初期のグーグルは、他のページへ向かうリンクを均等に分割した値がリンクの重要度になると述べた、1999年に発表された「ページランクの言及ランク: ウェブに秩序を」に記載された記述を素通りしていた可能性が高い。今回の特許は、グーグルがリンクの価値を異なる方法で評価するために用いてきた多数のアプローチを説明している。しかし、上述のリストは、確実なガイドラインとしてではなく、あくまでも、リンクが評価される可能性のある例として見てもらいたい。
いずれせよ大体の目安は抑えていると思う。リーズナブルサーファーに最も選択される確率が高いリンクこそが、最も重要度の高いリンクと言えるのではないだろうか。
この記事は、SEO by the Seaに掲載された「Google’s Reasonable Surfer: How the Value of a Link May Differ Based upon Link and Document Features and User Data」を翻訳した内容です。
リーズナブルサーファー(Reasonable Surfer)という言葉は単純なロボットと違い、実際にサイトを使用するユーザーという意味かと思いますが、確かにその観点でリンクを評価するアルゴリズムは検索順位を決める上でもより適切なものではと思います。一点、「リンクに関連するアンカーテキストの商業的な度合い」とは有料リンク、SEOのためのリンクということでしょうが、ここをより詳しく知りたいですね。
記事にも書かれているように、全てが現在のGoogleのアルゴリズムに適用されているわけではないでしょうが、しかし、良く考えているな、ということは伝わりますね。リスト上の位置だとか、リンクの色だとか、ここに書かれている細かいことを「SEO的にどうすべきか」という観点で気にしだすと大変なことになりそうですが、いずれにしてもユーザーに使いやすいサイトを作る、リンクも使いやすいリンクにすることが大事なのですかね。 — SEO Japan
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。