2010年5月上旬、多くのサイトのオーナー達がグーグルのランキングの変更に気づいた。その結果、多くのサイトがトラフィックを失っていた。5月1日に変更が実施されたため、このアップデートは多くの人々にメーデーアップデートと呼ばれた。
グーグルのウェブスパム部門を統括するマット・カッツ氏は、この変更に関する動画を配信し、グーグルはランキングでブランドを重要視するようになったのか?と言う疑問に対する答えの中で、このプロジェクトに取り組んでいる検索エンジニアの名を取って、このアップデートが「ヴィンスアップデート」と社内で呼ばれていることを明かした。
2月24日、グーグルの公式ブログにマット・カッツ氏とグーグルフェローのアミット・シンガル氏が、「結果でより質の高いサイトを見つける」と言うタイトルのエントリを投稿し、検索結果におけるウェブページのランキングの大きな変更について発表を行った。このエントリは、この変更により“グーグルのクエリの11.8%に著しく影響が及ぶ”と指摘していた。
この変更を行った理由は次のようなものであった:
「質の低いサイトのランキングを下げる – 質の低いサイトとは、ユーザーにとって価値が低いサイト、その他のウェブサイトからコンテンツをコピーしているサイト、そして、ただ単に役に立たないサイトを意味する。
同時に質の高いサイトのランキングを優遇する – 質の高いサイトとは、オリジナルのコンテンツを持ち、リサーチ、詳細なレポート、意義深い分析等の情報を含むサイトを意味する。
先月、ワイアードは、「ファームを嫌うパンダ: Q&A Googleのエンジニアのトップを直撃」と言うタイトルのマット・カッツ氏とアミット・シンガル氏へのインタビューを配信した。
このインタビューでは、両氏は、このアップデートが、質の高いサイトが、質の低いサイトよりも検索結果のランキングで上位に格付けされることを目指して行われたと述べている。
アップデートに関する記事を綴った人達の多くが、コンテンツファームのウェブサイトをターゲットにしているように見えるため、このアップデートを“ファーマーアップデート”と呼んでいたが、このインタビューでカッツ氏は、今回のアップデートに携わった重要なエンジニアの一人の名前を基に“ビッグパンダ”と呼ばれる社内のコードネームを明かした。
このアップデートには、以下のような質問の数を基にウェブサイトを分類する作業が含まれているようだ:
- このサイトは信頼できるか?
- 雑誌の一部であっても受け入れられるか?
- 広告が多過ぎるか?
そこで、私はグーグルでパンダを検索してみた。
すると、Biswanath Panda氏の名前に遭遇した。
Biswanath Panda氏、そして、その他の数名のグーグラーが2009年に発表したホワイトペーパーは、広告システムでグーグルが実施している実験を取り上げていた。この実験は、広告のクリックに関連する直帰率を基に広告およびランディングページの質を広告システムが学ぶことが出来るかどうかを確かめるものであった。
このホワイトペーパーは、実験における広告の有効性にはさほど注目せず、学習システムが大量のデータに対応する能力に着目している。
これが当該のホワイトペーパーだ:
「PLANET: マップリデュースを使った階層の集合体の大幅な平行学習」(PDF)著: Biswanath Panda、Joshua S. Herbach、Sugato Basu、Roberto J. Bayardo このホワイトペーパーは元々第35回 ベリーラージベータベース国際会議紀要(VLDB-2009)で発表された。
結論では、著者は実験で有料検索の問題に注目しているものの、大規模な学習の問題に関わるその他の問題の解決に取り組む一方で、同じように有効な結果を達成することを期待していると綴っている。
ファーマー/パンダアップデートでは、大量のウェブサイトが、サイト内のページのコンテンツの質に基づいて分類されている可能性が高い。階層の集合体に関するホワイトペーパーで説明されているプロセスは、ランキングの変更の有力候補であり、ページの質を特定するために上述の質問の類への答えを基に検索結果の格付けを行うことが考えられる。
先月投稿した文書レベルの分類子とGoogleがスパムを特定する仕組みで、私はグーグルがウェブページをページの性質を基に分類する仕組みの例を紹介した。
私がエントリの中で取り上げた特許は、グーグルがウェブページで用いられている言語を特定する方法に関するヒントを与えてくれるが、私はグーグルがページに関する質問を投げかけて、ページがウェブスパムと考えられるかどうかを特定し、分類している点をこのエントリの要点に据えて説明した。
文書レベルの分類子のエントリの中で、私はグーグルが求めている可能性のあるアイテムに触れたが、ページで見つかった広告の数は位置、ページ上の新しいコンテンツまたは重複するコンテンツの数等を含む、その他のファクターが関わっている可能性はある。
Biswanath Pandaは、マット・カッツ氏がワイアードの記事で触れていた“パンダ”なのだろうか?グーグルは階層の集合体のホワイトページで綴られているようなアプローチを採用したのだろうか?
それが大事なことだとは私には思えない。
本当に大事なのは、アップデートが、グーグルが質が高いと考えるサイトを結果で押し上げ、質の低いページを降格させる作業に専念していることだ。
このアップデートの教訓は、“検索結果のランキングがページの質をさらに重要視”している点がより明白になった点である。
グーグルはどのように“質”を決めているのだろうか?
この疑問こそが、アップデートが行われて以来、サイトのオーナーが直面している問題である。
この記事は、SEO by the Seaに掲載された「Searching Google for Big Panda and Finding Decision Trees」を翻訳した内容です。
真偽の程はGoogle(のごく一部の人間)のみぞ知る、のでしょうが、かなり当たっている部分がありそうな感じもしますね。もちろん、なんだかんだいっても結局後半の数行に集約されるのですけどね。「Googleは検索結果のランキングにおいてページの質をさらに重要視している。」いずれはどんなスパム含むSEOのテクニックで順位を上げることができなくなる日が来るのでしょうか・・・。今も相当難しいんですけど、まだまだ適度にリンクを張ることで順位が多少なりとも上がることもあるわけで。1年後、3年後、5年後、そして10年後の検索結果がどうなっているか興味深いです。 — SEO Japan
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。