ここ最近、私はグーグルのConfuciusと言うコードネームがつけられたソーシャルQ & Aサイトのリサーチを行っている。このサイトは複数の言語が用いられ、68ヶ国以上に展開されているものの、米国ではほとんど知られていない。私の調査結果からは、グーグルプラス、グーグルプラスに投稿されたコンテンツがグーグルのウェブ検索で格付けされる仕組み、そして、昨年、ノースカロライナで行われたワールドワイドウェブカンファレンスで最優秀論文賞にノミネートされた論文で詳細が綴られていた、グーグルプラスの考えられる広告モデルに関するヒントを見出すことが出来る。
私は「グーグルがグーグルおよびその他のソーシャルネットワークでユーザーが作成したウェブコンテンツを格付けする仕組み」を投稿した1週間前にConfuciusの調査を始めた。私はこのエントリでウェブの検索結果でユーザーが作ったコンテンツのランキングシグナルが、それぞれの話題におけるユーザーの他人からの信頼の度合い、そして、ネットワークでの交流における貢献の質から算出されると説明した。この2つを合わせたスコアは、ユーザーが作成するコンテンツに対するウェブの検索結果のランキングシグナルとして用いられる可能性がある。この特許は、米国の特許商標局ではなく、世界知的所有権機関のウェブサイトで公開されており、下のプロフィールページを見れば分かるように、グーグル中国のリサーチ部門のトップ、Edward Y. Chang氏を含むグーグル中国のスタッフが著者の欄に名前を連ねている:
上のイメージは情報および知識管理に関する第18回ACMカンファレンス(ACM CIKM)で「Confucius、そして、その賢い弟子達」と言うタイトルのプレゼンでEdward Y. Chang氏が使っていたスライドである。この円と下の円は、グーグルプラスを使ったことがある人には見覚えがあるのではないだろうか。
また、Confuciusのメカニズムの仕組みの一部、そして、ユーザーがグーグルのウェブ検索で質問を投げかけると、Confuciusで質問を尋ねるように促される仕組みを説明する論文も存在する。この論文「Confuciusとその賢い弟子達: ソーシャルと検索を統合」(PDF)は、グーグルのリサーチ部門のXiance Si氏、Edward Y. Chang氏、Zoltan Gyongyi氏、そして、清華大学のMaosong Sun氏によって作成された。
先程も申し上げたように、Confuciusは、現時点で少なくとも68ヶ国で提供されており、アフリカ(英語とフランス語)の40ヶ国、中国、ロシア、タイ、インドネシア、そして、多数のアラビア語圏の国々で利用することが出来る。
以下にアフリカの英語版のスクリーンショットを掲載する:
このサイトは、様々な方法でポイントを獲得してレベルを上げることが可能であり、例えば各種のアクティビティに対してバッジが用意されている。このサイトは皆さんがウェブでご覧になったことがある大半のクエッション & アンサーサイト(Q & A)とそれほど変わりはないが、サイトの裏側の一部のマジックは、見えないところで、そして、グーグルとインタラクトする方法に隠されている。検索エンジンからグーグルにこのサイトで質問を投げかけるように促されるQ & Aサイトは、Confuciusを除いて他にどれほどあるのだろうか?
Confuciusとその賢い弟子達」の論文に掲載されていた下のイメージには、Confuciusのシステムのユニークな側面が幾つか描かれている:
この論文には、Confuciusの前提に関する情報、そして、システムをまとめる上での主要な難題が提供されている:
このシステムを他のシステムとは若干異なる存在に変えるメカニズムの一部を以下に挙げていく:
1. 検索結果への統合:
誰かがグーグルでクエリを入力する際に、検索がwh-クエリ(when、where、why等)の場合、もしくは検索エンジンが十分な関連する結果を返すことが出来ない場合(例えば、不十分な検索コンテンツが存在し、クエリの用語の間で重複が見られ、上位に格付けされる可能性のあるページが下位に格付けされてしまうケース)、ConfuciusのQ & Aセッションが検索結果で推奨され、検索エンジンのユーザーにこのQ & Aサイトで質問を投げかけることを勧める。
2.質問のラベリング:
誰かが質問を入力すると、カテゴリーのラベルが質問者に提案される。このラベルは、ラベルに関連するトピックを登録させ、そして、質問を当該のトピックに詳しい人達に送ることが出来るようになるため、質問をまとめる際に役に立つ。論文の著者は、「潜在的ディリクレ配分の並列実装(PLDA)」を採用して、ラベルの提案を行っていると述べている。
3. 質問を勧める:
早いレスポンスを提供し、何度も同じ質問へ解答する状況を避けるため、このシステムの質問推奨機能が同様の質問を探して、答えを提供する。PLDAが過去に尋ねられた質問を探し出す上でも役に立つようだ。
4. 答えの質を評価する:
先週、ユーザーが作成したコンテンツのランク付けに関するエントリで取り上げた特許は、答えとレスポンスと同様に質問やオリジナルの投稿が、質に関して評価される仕組みを詳しく説明している。答えの質は、質問にどれだけ関連しているか、当該の質問や同様の質問への他の答えと比べて、どれだけオリジナリティがあるか、レスポンスが網羅する範囲がどれだけ広いか(関連する用語の幅広い組み合わせを使っているかどうか)等によって左右される。この評価は、システム内の上位の貢献者だけでなく、スパムを投稿しているメンバーを見つけて、スパムを抑制する効果もある。
5. ユーザーのランキング:
システムの利用は、貢献および他のユーザーとの交流に基づいて格付けされる。このランキングは、専門知識の様々な領域をベースに行われ、当該の領域の上位のコントリビュータを特定するために用いられ、質問に答える人達にインセンティブを与え、専門知識を持つ人達に質問を送る際の判断材料になる。
6. NLP-ベースの答えの生成:
質問への答えを提供してもらう以外にも、Confuciusは、例えば、「デレク・ジーターの誕生日はいつ?」のように、グーグルがグーグル.comのQ & Aの結果で行う方法とほとんど同じ方法で、Confucius自身も一部の質問に答える。
結論
Google Confuciusはグーグルプラスよりも遥かにQ & A色が圧倒的に濃いが、Confuciusで策定された多数のアイデアがグーグルプラスの一部になる可能性はある。上に掲載した円は一時期Confuciusの一部だった可能性があるが、少し調べ回ってみたが、現在、別のConfuciusのバージョンには掲載されていなかった。プロフィールページを見るために、私はアフリカの英語版のQ & Aサイトに登録した。円は一つもなかった。また、誰も連絡先を加えなかった。
グーグルプラスに持ち込まれたアイデアの中には、関連するグーグルプラスのコンテンツが検索結果に表示されるかどうかを決めるための個人の信頼/貢献のランキングも含まれている可能性がある。
この論文「AdHeat: 広告のマッチングに対してヒントを送る影響を基にした伝達モデル PDF(プレゼンテーション: AdHeat、影響を基にしたソーシャル広告モデルとテラスケールのアルゴリズム)」は、ノースカロライナで行われたWWW2010カンファレンスで最優秀論文賞にノミネートされており、時間を割いてじっくり目を通す価値はある。論文で描かれているように、AdHeatは、コンテンツに広告をマッチングさせるための関連性に加えて、ユーザーの影響を考慮するソーシャル広告モデルである:
私達は中国、ロシア、タイ、そして、アラブ語圏の17ヶ国で利用可能なオンラインQ & AサイトのGoogle Confuciusで3つの実験を行った。結果を見ると、Ad-Heatはコンテンツレレバンス広告モデル、そして、ユーザーターゲッティング広告モデルよりも効果的であることが分かり、CTRにおいては圧倒的な差で勝っていた。
AdHeatはグーグルプラスで用いられるのだろうか?その可能性はある。
この記事は、SEO by the Seaに掲載された「Early Google Circles and the Google Social Site You Might Not Know About」を翻訳した内容です。
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。