TOP
メディア
Googleが68ヶ国以上で密かに展開するソーシャルQ&Aサイトとは？

Googleが68ヶ国以上で密かに展開するソーシャルQ&Aサイトとは？

公開日：2011/10/19

最終更新日：2024/02/17

ブログ

GoogleのQ&Aサイトといえば、過去に見事に失敗したGoogle Answersが思い浮かびますが（唯一のYahoo!の勝利例ともいわれましたが）、実はGoogleがなんと世界68ヶ国以上で展開しているソーシャルQ&Aサイトがあることを知っている人はいるでしょうか？私もこの記事を読むまで全く知らなかったのですが、その名もConfucius（孔子）という大胆なネーミング。今回はそのプロジェクトの技術や機能がGoogle+に利用される可能性もあるということで、その実態に迫ってみたいと思います。 — SEO Japan

ここ最近、私はグーグルのConfuciusと言うコードネームがつけられたソーシャルQ & Aサイトのリサーチを行っている。このサイトは複数の言語が用いられ、68ヶ国以上に展開されているものの、米国ではほとんど知られていない。私の調査結果からは、グーグルプラス、グーグルプラスに投稿されたコンテンツがグーグルのウェブ検索で格付けされる仕組み、そして、昨年、ノースカロライナで行われたワールドワイドウェブカンファレンスで最優秀論文賞にノミネートされた論文で詳細が綴られていた、グーグルプラスの考えられる広告モデルに関するヒントを見出すことが出来る。

私は「グーグルがグーグルおよびその他のソーシャルネットワークでユーザーが作成したウェブコンテンツを格付けする仕組み」を投稿した1週間前にConfuciusの調査を始めた。私はこのエントリでウェブの検索結果でユーザーが作ったコンテンツのランキングシグナルが、それぞれの話題におけるユーザーの他人からの信頼の度合い、そして、ネットワークでの交流における貢献の質から算出されると説明した。この2つを合わせたスコアは、ユーザーが作成するコンテンツに対するウェブの検索結果のランキングシグナルとして用いられる可能性がある。この特許は、米国の特許商標局ではなく、世界知的所有権機関のウェブサイトで公開されており、下のプロフィールページを見れば分かるように、グーグル中国のリサーチ部門のトップ、Edward Y. Chang氏を含むグーグル中国のスタッフが著者の欄に名前を連ねている:

上のイメージは情報および知識管理に関する第18回ACMカンファレンス（ACM CIKM）で「Confucius、そして、その賢い弟子達」と言うタイトルのプレゼンでEdward Y. Chang氏が使っていたスライドである。この円と下の円は、グーグルプラスを使ったことがある人には見覚えがあるのではないだろうか。

A social networking profile for Google Research China Head, Edward Y. Chang, showing contacts in a blue circle similar to the circles in Google Plus.

また、Confuciusのメカニズムの仕組みの一部、そして、ユーザーがグーグルのウェブ検索で質問を投げかけると、Confuciusで質問を尋ねるように促される仕組みを説明する論文も存在する。この論文「Confuciusとその賢い弟子達: ソーシャルと検索を統合」（PDF）は、グーグルのリサーチ部門のXiance Si氏、Edward Y. Chang氏、Zoltan Gyongyi氏、そして、清華大学のMaosong Sun氏によって作成された。

先程も申し上げたように、Confuciusは、現時点で少なくとも68ヶ国で提供されており、アフリカ（英語とフランス語）の40ヶ国、中国、ロシア、タイ、インドネシア、そして、多数のアラビア語圏の国々で利用することが出来る。

以下にアフリカの英語版のスクリーンショットを掲載する:

A screenshot of the African version of Google Confucius.

このサイトは、様々な方法でポイントを獲得してレベルを上げることが可能であり、例えば各種のアクティビティに対してバッジが用意されている。このサイトは皆さんがウェブでご覧になったことがある大半のクエッション & アンサーサイト（Q & A）とそれほど変わりはないが、サイトの裏側の一部のマジックは、見えないところで、そして、グーグルとインタラクトする方法に隠されている。検索エンジンからグーグルにこのサイトで質問を投げかけるように促されるQ & Aサイトは、Confuciusを除いて他にどれほどあるのだろうか？

Confuciusとその賢い弟子達」の論文に掲載されていた下のイメージには、Confuciusのシステムのユニークな側面が幾つか描かれている:

A flow chart of systems behind Google Confucius.

この論文には、Confuciusの前提に関する情報、そして、システムをまとめる上での主要な難題が提供されている:

ユーザーはインセンティブ抜きでは答えを提供しない。
インセンティブが存在する場合、システムを濫用またはスパムする人物が現れ、サービスの質を下げ、博識なユーザーが参加しなくなる。
質問が投げかけられると、その領域の専門家にすぐに送られ、なるべく早く答えが提供されるようにするべきである。
質問への答えが既に提供されている場合、余分な作業と不要な遅れを避けるために、容易に見つけられるようにするべきである。

このシステムを他のシステムとは若干異なる存在に変えるメカニズムの一部を以下に挙げていく:

1. 検索結果への統合:

誰かがグーグルでクエリを入力する際に、検索がwh-クエリ（when、where、why等）の場合、もしくは検索エンジンが十分な関連する結果を返すことが出来ない場合（例えば、不十分な検索コンテンツが存在し、クエリの用語の間で重複が見られ、上位に格付けされる可能性のあるページが下位に格付けされてしまうケース）、ConfuciusのQ & Aセッションが検索結果で推奨され、検索エンジンのユーザーにこのQ & Aサイトで質問を投げかけることを勧める。

2.質問のラベリング:

誰かが質問を入力すると、カテゴリーのラベルが質問者に提案される。このラベルは、ラベルに関連するトピックを登録させ、そして、質問を当該のトピックに詳しい人達に送ることが出来るようになるため、質問をまとめる際に役に立つ。論文の著者は、「潜在的ディリクレ配分の並列実装（PLDA）」を採用して、ラベルの提案を行っていると述べている。

3. 質問を勧める:

早いレスポンスを提供し、何度も同じ質問へ解答する状況を避けるため、このシステムの質問推奨機能が同様の質問を探して、答えを提供する。PLDAが過去に尋ねられた質問を探し出す上でも役に立つようだ。

4. 答えの質を評価する:

先週、ユーザーが作成したコンテンツのランク付けに関するエントリで取り上げた特許は、答えとレスポンスと同様に質問やオリジナルの投稿が、質に関して評価される仕組みを詳しく説明している。答えの質は、質問にどれだけ関連しているか、当該の質問や同様の質問への他の答えと比べて、どれだけオリジナリティがあるか、レスポンスが網羅する範囲がどれだけ広いか（関連する用語の幅広い組み合わせを使っているかどうか）等によって左右される。この評価は、システム内の上位の貢献者だけでなく、スパムを投稿しているメンバーを見つけて、スパムを抑制する効果もある。

5. ユーザーのランキング:

システムの利用は、貢献および他のユーザーとの交流に基づいて格付けされる。このランキングは、専門知識の様々な領域をベースに行われ、当該の領域の上位のコントリビュータを特定するために用いられ、質問に答える人達にインセンティブを与え、専門知識を持つ人達に質問を送る際の判断材料になる。

6. NLP-ベースの答えの生成:

質問への答えを提供してもらう以外にも、Confuciusは、例えば、「デレク・ジーターの誕生日はいつ？」のように、グーグルがグーグル.comのQ & Aの結果で行う方法とほとんど同じ方法で、Confucius自身も一部の質問に答える。

結論

Google Confuciusはグーグルプラスよりも遥かにQ & A色が圧倒的に濃いが、Confuciusで策定された多数のアイデアがグーグルプラスの一部になる可能性はある。上に掲載した円は一時期Confuciusの一部だった可能性があるが、少し調べ回ってみたが、現在、別のConfuciusのバージョンには掲載されていなかった。プロフィールページを見るために、私はアフリカの英語版のQ & Aサイトに登録した。円は一つもなかった。また、誰も連絡先を加えなかった。

グーグルプラスに持ち込まれたアイデアの中には、関連するグーグルプラスのコンテンツが検索結果に表示されるかどうかを決めるための個人の信頼/貢献のランキングも含まれている可能性がある。

この論文「AdHeat: 広告のマッチングに対してヒントを送る影響を基にした伝達モデル PDF（プレゼンテーション: AdHeat、影響を基にしたソーシャル広告モデルとテラスケールのアルゴリズム）」は、ノースカロライナで行われたWWW2010カンファレンスで最優秀論文賞にノミネートされており、時間を割いてじっくり目を通す価値はある。論文で描かれているように、AdHeatは、コンテンツに広告をマッチングさせるための関連性に加えて、ユーザーの影響を考慮するソーシャル広告モデルである:

私達は中国、ロシア、タイ、そして、アラブ語圏の17ヶ国で利用可能なオンラインQ & AサイトのGoogle Confuciusで3つの実験を行った。結果を見ると、Ad-Heatはコンテンツレレバンス広告モデル、そして、ユーザーターゲッティング広告モデルよりも効果的であることが分かり、CTRにおいては圧倒的な差で勝っていた。

AdHeatはグーグルプラスで用いられるのだろうか？その可能性はある。

この記事は、SEO by the Seaに掲載された「Early Google Circles and the Google Social Site You Might Not Know About」を翻訳した内容です。

元々、中国で他社サイト内で初めたものなんですね。68ヶ国といってもアフリカが40以上占めているようですし、見た所、それ程流行っている感じでもないですが、Q&Aサイト自体は世界的に完全に1ジャンルとして地位を持った存在ですし、ここで学んだことをGoogle+に利用するということだけも価値があるのかもしれません。後半の分析記事を読んでも普通に納得感のある内容ですし、ソーシャルメディア自体がQ&Aサイト、検索エンジン化しつつある現在、こういったソーシャルランキングのアルゴリズムは、より良いユーザー体験をプラットフォームが提供するためにも益々重要になってくるのでしょうね。– SEO Japan