ヤフー!で「ワールドカップ」(引用符なしで)と言うフレーズを検索すると、検索エンジンは、ワールドカップ自体は4年に一度のペースで開催されているにも関わらず、また、特定の年に焦点を絞っていない関連するページが多数存在するにも関わらず、2010年のワールドカップに関するページを表示する可能性が高い。
誰かが“ワールドカップ”と検索するとき、その人物が2010年6月11日から7月11日に南アフリカで開催される大会に関する情報を求めている可能性はどれぐらいあるだろうか?一方、2006年に開催されたワールドカップに関する情報を求めている可能性はどうだろうか?あるいはワールドカップに関する一般的なページを求めている可能性はどれぐらいあるだろうか?
もし、検索エンジンが、このような検索結果のランキングを時間ベースのデータを基に変えていると言ったら、皆さんは驚くだろうか?それとも、オリンピックやワールドシーリーズやワールドカップ等の検索のように、時間的な特徴が検索に見られる際に、ヤフー!やグーグルやビングが、このような方法で検索結果のランクを再び計算していることをある程度予測しているだろうか?
検索エンジンは、クエリのログを調べ、頻繁に年、月、日、もしくは時刻等の時間に関するデータの類を含む、より具体的な検索に特定のクエリが盛り込まれているかどうかを確認し、検索者のクエリを書き換え、時間ベースの情報を検索結果に組み込んでいる可能性は大いにある。 先日出願されたヤフー!の特許は、このような情報を表示する際のシンプルなアプローチを説明している。以下に特許のデータを掲載する:
一時的に適性なクエリの間接的な特定および拡大
考案: ロージー・ジョーンズ、ドナルド・メッツラー、フーチュン・ホー
譲渡先: Yahoo!
米国特許出願番号: 20100131538
公開日: 2010年5月27日
申請日: 2008年11月24日
要約
暗に時間の制限を持つクエリ、すなわち期間が示唆されているものの、明確には提示されていないクエリを特定し、そして、このようなクエリを拡大し、1つ、もしくは複数の時間の関連性を含めるためのメソッドおよび装置。
私は以前ヤフー!が、検索者が地理的な用語を含めていないものの、検索エンジンが検索結果に対して地理的な位置を暗示することで最高の検索結果が得られるような、特定のクエリを見る方法を「検索エンジンが地域的なクエリ vs 世界的なクエリの意図を推測する仕組み」の中で説明した。また、このような時間に関するデータが同じような方法で用いられる可能性がある過去のヤフー!の特許に関するエントリ、「検索エンジンが検索者の意図を検索エンジンのクエリログの分析を介してマッチさせようとする仕組み」も投稿しているので、参考にしてもらいたい。
この特許は、検索エンジンがクエリログから得た検索者の意図に関する情報を分析または更新して、時間ベースの情報を含む検索結果により重要度を置く仕組みをさらに明確に詳細を説明している。
例えば、カウントベースのアプローチはあらゆるクエリを見るために利用される可能性がある:
1) 検索エンジンのクエリログは、例えば年を検索で用語の前もしくは後に入力するように(2004 オリンピック、オリンピック 2008)、明確に特定の年を含むクエリの数をカウントするために分析される可能性がある。
2) 用語がクエリ内で利用される回数もカウントされる。
3) 広範なクエリが利用されたすべての時間に対して、特定の年/クエリのコンビネーションの比率の計算が行われる。例えば、(オリンピック+2004)/オリンピック、または(オリンピック+2008)/オリンピック。
4) この比率が特定の閾値を超えると、そのクエリの用語を含むすべてのクエリが“暗に年の制限が行われた”と見なされる。
この類のクエリログの分析は、誰かが「ワールドカップ」や「オリンピック」等の用語を検索する度に実施されるのではなく、オフラインの状態で行われる可能性が高い。そして、キャッシュされたログファイルの情報は、検索行動のデータが変わる度に継続的に更新されるだろう。
ヤフー!で「ワールドカップ」を検索すると、検索エンジンは、検索結果の上部に「ワールドカップ 2010」と「ワールドカップ 2006」を含む検索提案“~で検索”を数多く提示する。この特許は、検索エンジンがこのような類のクエリの提案、もしくは、検索者が検索に最も関連する年を選択するために利用するタイムラインを提供する可能性がある点にも触れている。
また、この特許には、検索エンジンが検索結果の上部に最も関連する年を含めるために修正した旨を伝えるメッセージを掲載する点、そして、修正を検索者が拒むことが出来る手段を与える点も明記されている。
特定の年を含むクエリの率を計算するアプローチはもう一つ考えられる。それは、検索エンジンが検索者の個別のクエリのセッションをチェックし、検索者がクエリを修正し、年を含めている回数を確認する方法だ。
そのため、誰かが特定の年のアメリカンアイドルを調べたいと思ったとき、そして、最初の検索が「アメリカンアイドル」で、次の検索が「アメリカンアイドル 2006」のように特定の年を含んでいた場合、特定のクエリから得たそのクエリのデータは上述したクエリの回数の代わりに用いられる可能性がある。
ヤフー!の検索結果で「アメリカンアイドル」と言うクエリに対して年を含むページが一つしかないものの、ヤフー!の検索ボックスの下に表示される「予想」検索結果が、「アメリカンアイドル 2010」、「アメリカンアイドル 2009」そして、「アメリカンアイドル 2008」を提案する。時間ベースの情報は、この類の時間に関するデータがランクを調整するために用いられていない場合でも、予測検索において提供される可能性があるようだ。
この特許によると、検索エンジンは年以外にも以下のような時間的なデータに注目するのではないかと見られている:
検索エンジンは、検索者が検索ボックスに入力する際のキーワード以外の要素にも注目しようと試みている。 検索の裏にある意図を理解するため、検索エンジンはクエリログのファイルに目を通し、クエリの用語に関連して、他の人々が何を検索しているのか調べている可能性がある。
このクエリログの情報は、場合によっては、ロケーションベースの意図、時間ベースの意図、もしくは別の意図を完全に明らかにすることが出来るだろう。
ロケーションと時間以外に、検索エンジンはクエリログ内のどのシグナルに着目し、検索結果のランクを再び格付けしているのだろうか?
検索結果を再びランク付けするこの類の取り組みは、検索エンジンの最新の動向を気にしている人が予想不可能なものであってはならない。
「ワールドカップ」を検索すれば、検索エンジンが、この大会に対する検索結果で、2010年に焦点を絞るためにランクを調整している点はハッキリするだろう。私個人は、年ではない期間に基づいて検索結果の格付けが再び行われる状況には遭遇したことがないが、調べてみる価値はあるだろう。もし、上述した時間を基に検索結果のランキングをつけ直す取り組みの例を思いつき、共有してもらえるなら、コメント欄で発表してもらいたい。
この記事は、SEO by the SEAに掲載された「How a Search Engine Might Rerank Search Results Based upon Time-Based Data in Query Logs」を翻訳した内容です。
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。