Googleが検索順位を決定するアルゴリズムには、実に数百もの指標があると言われています。
それは外からは知る由もないことですが、「Googleはユーザーの感情を分析して検索順位を決定している」という説があるようです。最もらしく聞こえますが、果たしてそれは事実なのでしょうか。
今回は、感情分析=センチメント分析とGoogleの検索アルゴリズムについての記事をSearch Engine Journalよりご紹介します。少し堅い記事となっていますが、参考になる内容となっています。
Googleがセンチメント分析(感情分析)を使用して、Webページを順位付けしていることは事実だ。
多くのSEO担当者は、Webページの”感情”がGoogleがページを順位付けすることに影響を与えていると信じている。
検索結果(SERP)で順位付けされたすべてのページがポジティブな感情を含む場合、ネガティブな感情が含まれているとページを順位付けできないと考えられている。
センチメント分析の観点からは、Googleの調査がどこに焦点を合わせてきたかを示すのに有効なエビデンスとファクトがある。
Google関連の特許の専門家であるビル・スロースキ氏(@bill_slawski)に、Googleがセンチメント分析を使用してWebページを順位付けするというSEO理論について、彼がどう思っているかを尋ねた。
感情とは、バニラやチョコレートの味のようなものだ。それは記事の持つ情報提供能力を直接的に示すものではない。
情報提供能力は、NLP処理を使用してエンティティとそれらに関する知識を抽出することで理解でき、それは情報提供能力の算定に繋がる可能性がある。
感情の値は、記事がトピックにもたらす可能性のある情報の量を必ずしも反映しない。
ポジティブ、もしくはネガティブな感情それ自体は、ページにどれだけの知識が存在し、トピックに追加されているかを反映するものではない。
ビル氏は、Googleがレビュー関連のクエリに対し、様々な意見を示す傾向があることを確認した。
Googleが1つの感情を、他の感情より優先するとは思わない。それはトピックに潜在的な偏見を示すものだ。
Googleは感情に関して、ある程度の多様性の存在を望んでいると思う。
したがって、彼らがその意思に基づいて検索エンジンを動かしている場合、彼らはポジティブな情報もネガティブな情報も、どちらか一方だけを示すことはないだろう。
Googleの検索結果が感情の偏りをもたらした場合における有用性の欠如について、ビルは優れた点を示した。
一部のSEO担当者は、すべての検索結果にポジティブな感情が存在する場合、それは検索者が探しているものを反映していると考えている。しかし、それは単純な相関に過ぎない。
その結果が表示された理由を説明するためには、リンクなど、数多くのランキング要素がある。ユーザーが特定のクエリで特定のサイトを表示したがっているなど、他の要因もある。
1つの要素を取り出して、「すべてのサイトにこの要素があるので、このような検索結果となっている」と単純化すべきではない。「そうであってほしい」と願ったことを口に出しているだけだ。
例えば、同じSEO担当者がある検索結果を見て、すべてのサイトが同じSEOプラグインを使用していることを確認したとしよう。
その場合、SEOプラグインが上位表示に寄与していることを意味するだろうか? 答えはNoだ。
同様に、検索結果に表示される感情は、検索者が探しているものを必ずしも反映していない。
これが、感情などの1つの要素だけを見てランキング要素を判断することが未熟だと思う理由だ。
相関関係が見受けられるからといって、それ自体はランキング要素とイコールではない。
目次
Googleは2018年以降、センチメント分析にほとんど触れていない。
2018年7月、Twitterでこのような質問がされた。
「検索エンジンのアルゴリズムは感情を認識して、それを考慮しているようだ。感情検索の演算子は存在するのか?」
この質問に対し、ダニー・サリバンは以下のように答えた。
「検索エンジンのアルゴリズムは感情を認識しない。したがって、そのような演算子は存在しない」
ダニー・サリバンは、Googleの検索アルゴリズムが感情を認識しないことを明らかにした。
2018年の最初に、ダニーは感情を述べた強調スニペットに関するGoogleの公式発表を行った。
しかし、感情の文脈では、一部のクエリには多様な意見が存在する可能性がある。そのため、Googleは2つの強調スニペット(一方は肯定的、もう一方は否定的)を表示する可能性があるということだった。
「爬虫類は良いペットか?」を検索するユーザーは、「爬虫類は悪いペットである」と同じ強調スニペットを取得することになる。彼らは同じ情報を求めているためだ。
爬虫類はペットとしてどのように評価されるか? ただし、キーワードによって強調スニペットは矛盾しているように見えるかもしれない。
爬虫類は良いペットであると主張するページは、爬虫類が良いペットであると信じて検索する人々に適している。同様に、爬虫類が悪いペットであると主張するページは、爬虫類が悪いと信じて検索する人々に適している。
このような場合に複数の回答を表示する必要があると思うが、この課題の解決策を模索しているところだ。
このセクションのポイントは、Googleが複数の回答を示すことを模索しているということだ。
2018年以降、Googleは「爬虫類は良いペットか?」といった曖昧なクエリにおいて、強調スニペットの表示を停止している。そして、ユーザーに再考を勧め、より具体的な爬虫類について検索するように促す。
ダニー・サリバンは以下のようにも書いていた。
「サイト運営者によって提供される意見は多様性に富んでおり、ユーザーが複数の視点から情報を取得できるような経路を提供したいと考えている」。強調スニペットチームを率いるソフトウェアエンジニアであるマシュー・グレイは私にこう言った。
これらの声明は、検索結果の感情がどちらかに傾く場合、サイトを順位付けするためにはどちらかに寄せなければならないというSEO担当者の考えに矛盾している。
Googleはむしろ、意見の多様性を示したいと主張している。
Googleの研究論文である「Structured Models for Fine-to-Coarse Sentiment Analysis(微細なセンチメント分析のための構造化モデル)」では、質問応答システムには段落レベルでのセンチメント分析が必要であると述べている。
レビューを要約するシステムは、文または語句レベルでポジティブか、もしくはネガティブな意見を理解する必要がある。
これはオピニオンマイニングと呼ばれることもある。この種の分析のポイントは、意見を理解することだ。
研究論文では、センチメント分析の重要性を以下のように説明している。
「アプリケーションによって様々なニーズがあるため、感情を複数のレベルで分類する機能は重要だ。
例えば、製品レビューの要約システムでは、文または語句レベルでの極性分類が必要になる場合がある。
質問応答システムでは、おそらく段落ごとの感情の理解を必要とするだろう。そして、オンラインのニュース記事においては、どの部分が編集されたものなのかを判断するためには、文書レベルの分析を必要とする」
さらに、センチメント分析がどのように役立つかについても説明している。
「”解析と関係の抽出”,”エンティティのラベル付けと関係の抽出”,”品詞のタグ付けとチャンキング”。感情分析に関する興味深い研究のひとつは、Popescu and Etzioniによるもので、製品の機能に対して、フレーズ単位でのセンチメント分析を試みている。」
その研究が際立っているポイントは、厳密には「テキストが表している感情を理解しようとしている」ということだ。
よって、ユーザーの検索クエリに込められた感情に沿った検索結果を表示するためのコンテキストは存在しない。つまり、コンテキストは、感情によるテキストの順位付けに関するものではない。
しかし、感情がランキング要素に組み込まれていないことを知ってなお、一部のSEO担当者はこの種の調査を引用し、感情がランキング要素となっていることを主張する。
複数の研究論文は一貫して「テキストを理解すること」について述べており、そのテキストはランキング要素の文脈と外れたところにあり、その主張は間違っていると言えよう。
別の研究論文である「What’s Great and What’s Not: Learning to Classify the Scope of Negation for Improved Sentiment Analysis(何が正しく、何が違うのか:感情分析を改善するための否定範囲分類学習)」は、製品レビューの感情を理解する方法を示している。
※論文名は直訳
研究の範囲は、意見の表現方法の曖昧さに対処するためのより良い方法を見つけることだ。
これらの種類の否定文の例は次のとおりだ。
上記の例は、この研究論文が、人間が特定の方法で発した言葉の意味を理解することに焦点を当てる方法を示している。
これがセンチメント分析が、ポジティブおよびネガティブな感情だけを分析しているわけではない理由だ。
センチメント分析で本質的に解読しようとしているのは、言葉・フレーズ・段落・文書の意味についてだ。
この論文は、質疑応答を含むいくつかのシーンにおけるセンチメント分析の有用性を述べることから始まる。
言語否定の範囲の自動検出は、医療データマイニング、一般的な事実または関係の抽出、質疑応答、感情分析など、さまざまな文書を理解するタスクで発生する問題に対応するものだ。
これらの種類の文を正確に分類することは、アンサーエンジンとしての検索エンジンにどのように役立つのだろうか?
検索エンジンは、順位付けしたいWebページを理解しないと、質問に正確に答えることができない。
そのデータをランキング要素として使用するわけではない。そのデータを使用してページを理解し、ランキングの基準にしたがってページを順位付けできるようにする。
センチメント分析の1つの捉え方として、ランキングの候補となるWebページを取得することと考えるものがある。Webページを理解できない場合、検索エンジンは候補を選択できない。
検索エンジンがWebページを理解できると、質問に回答できる可能性が高いページに順位を付けることができる。
これは、上記の研究論文で示されているように、否定形であるなどの理由で意図が曖昧となっている検索クエリに有効だ。
Googleがセンチメント分析を使用しているとしても、センチメント分析によって、Webページが直接順位付けされているわけではない。センチメント分析は、順位を付ける上でWebページを理解するのに役立っている。
Googleは理解できないものに順位を付けられない。Googleは理解できない質問に答えることができない。
https://www.aaai.org/ocs/index.php/AAAI/AAAI14/paper/viewFile/8663/8620
この研究論文では、ユーザーがWebサイト・フォーラム・ブログなどにコメントを投稿する際、何を意味しているかをよりよく理解する方法を研究している。
「既存のトピックメソッドは、感情的なテキストをモデル化するだけであり、感情を表現するユーザーや、感情が表現されるアイテムは考慮しない。
ユーザーごと、アイテムごとに異なる感情表現が使用される可能性があるため、センチメント分析を行う際はユーザーとアイテムの情報をトピックモデルに組み込むことを主張したい。」
https://arxiv.org/pdf/1911.09762.pdf
ASRとは、自動音声認識を意味する。この研究論文では、スピーチを理解する上で、笑いや息継ぎのような言葉以外の抑揚に重きを置くことを示すものである。
調査では、重きを置く要素として、息継ぎと笑いを使用した例を共有しており、順位を付ける目的ではなく、音声感情分析のコンテキストによって感情を理解できるようにしている。
この論文では、音声感情分析が役立つ場所のコンテキストについて説明している。
音声感情分析は、カスタマーサービス・ヘルスケア・教育など、多くの業界で幅広いアプリケーションを備えたインタラクティブインテリジェンスシステムにとって重要な問題である。
音声感情分析が担うタスクは、発話された音声をポジティブ・ネガティブ・ニュートラルなどの固定セットのカテゴリのひとつに分類することだ。
この調査は、2020年以降に行われた非常に新しい調査であり、検索に限った内容ではない。
しかし、Googleが行っている調査の種類と、一般的なSEO担当者が単純化して捉えている”調査”よりもはるかに洗練されていることを示している。
Googleは一貫して、検索者の感情の意図をそのまま反映するページを表示しないようにすると述べた(「ヤモリは悪いペットですか?」に対するアンサー)。
実際、Googleはユーザーが求めていることと反対のことを示しており、多様な意見を示すことを試みている。Googleは検索クエリで表現された感情に対し、単純なアンサーを返さないようにしている。
上記のスクリーンショットからわかるように、Googleは検索クエリで表現された否定的な感情が、単純にネガティブな感情を抱かせるページを表示するトリガーになることを許可していない。
これは、検索クエリに感情バイアスが存在する場合、Googleが特定の感情に偏った検索結果を表示するという考えに矛盾する。
センチメント分析に関するGoogleの調査と特許は掘り下げることができる。そして、コンテキストは、検索クエリとWebページを理解することに関するものであることがわかる。
感情を分析して、その感情に沿ったページをそのまま順位付けするという調査は公表されていない。
Googleが上位に表示しているページの感情が偏っているからといって、その偏った内容が上位表示の要因であると決めつけないでほしい。
Googleの研究論文・公表された情報・検索結果から、Googleがサイトを順位付けする際に、検索クエリに含まれる感情をそのまま反映しているわけではないことは明らかだ。
Googleは検索結果に多様性を持たせたいと考えており、単にユーザーが望んでいる結果だけを表示しているわけではないという結果でした。
よくケースバイケースといいますが、検索するユーザーのその時々の感情や背景によって、適した内容は変わってくることでしょう。Googleとしても、検索結果の多様性・中立性を保つために尽力していることがわかる内容だったかと思います。
また、「手に入れた情報がすべてではなく、自分の望んでいる状態が事実とは限らない」という戒めを与えてくれる記事でした。感情を偏らせることなく、冷静に事実を判断して取り組んでいきたいですね。
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。