Googleより先日発表されたMUM(Multitask Unified Model)のように、Googleは次々と新しい検索技術の開発に取り組んでいるようです。Googleの検索精度には目を見張るものがありますが、その仕組みは非常に複雑でブラックボックスとなっております。そうした中、Googleが取得する特許の内容を見ることで、その仕組みを垣間見ることも可能です。今回は、ビル・スロウスキー氏による、Googleが取得した特許の解説記事を紹介します。
Googleの新しい特許によれば、検索者の意図をより良く満たすために、その検索におけるコンテキストに基づいたクエリの書き換えをGoogleは行っているようだ。
何年もの間、私は検索の背後にあるインテントについて議論している情報のソースを見てきた。検索エンジンの特許や、それらの特許について検索のエンジニアが述べていたことにも目を向けている。
Googleが「特定のコンテキストに対する検索者の意図の予測」という特許を新たに取得した際、この特許の著者を私は注目した。この特許は2021年2月に取得されている。
このような、検索意図についての特許に私は興味を持ち、「適切なクエリは検索エンジンがユーザーの検索意図を理解することに役立つ」や「なぜユーザーはGoogleを使用するのか?検索意図を測定するためのユーザーデータへの理解」といった記事を書いてきた。
これらは、検索関連のカンファレンスで私が出会ったプレゼンテーションのテーマでもある。こうしたプレゼンテーションでは、SEO担当者はターゲットキーワードの検索結果を見るべきだ、という主張がされている。
プレゼンテーションのスピーカーは、ターゲットキーワードで表示されているページの背後にある検索意図を見るべきだと勧めている。他の人がそのキーワードに対し、どのような最適化を施しているか、そのアイデアを得るためである。
「特定のコンテキストに対する検索者の意図の予測」は、検索者は情報や事実を得るためにコンピューターデバイスを使用し、検索者が特定のタスクを完了する手助けをすることができる、という内容から始まる。
検索エンジンにとって、あらゆる検索は、情報を発見しようとする際に使用されるクエリ(または、キーワード)を推測することから始まる。
この特許では、検索者が探している情報にコンピューターデバイスが検索者を導くためには、検索者が十分な情報(つまりは、検索クエリ)を提供する必要があると伝えている。
検索クエリが十分に調整されていない場合、または、検索者がクエリ以外の追加情報を十分に提供していない場合、コンピューターデバイスが返す情報量が過多となる可能性に注意すべきだ。
これは、最も興味深い情報や関連性のある情報を検索者が見つけにくくなってしまうことを意味する。
他の多くの特許と同様、この特許の説明の冒頭では、検索者が抱える可能性のある問題について言及している。
これらは、検索者が情報を探そうとする際に出くわす問題である。
非常に詳細なクエリをコンピューターデバイスに入力し、コンピューターデバイスに複数の検索を実行させ、大量の検索結果をふるいにかけたりしながら、特定のタスクを完了させるために必要な情報を得ることに、検索者はストレスを感じたり貴重な時間を無駄にしてしまう可能性がある。
多くの特許は、その特許で特定されている問題を解決するための方法を提供するアルゴリズムについての提案をしているが、今回の特許はまさにその点を突いている。
この特許の技術は、コンピューターデバイスが特定のコンテキストに対するクエリの検索意図を予測することに役立つ可能性を示している。
検索エンジンは、コンテキストの情報を見ることで、クエリの背後にある検索意図を把握することができるかもしれないのだ。
この特許では、いくつかの例が挙げられている。
コンピューターデバイスは検索クエリに関連するコンテキストを定義し、その関連するコンテキストに基づいて、その検索で使われたクエリのインテントや目的を予測することができるとしている。
この特許でのプロセスは検索結果を調整し、その検索から返される他の情報よりも、インテントを満たすための情報が強調されるようにする。
この特許では、こうしたプロセスを説明するための実例が挙げられている。
そのコンピューターデバイスのユーザーが映画館で公開されている特定の映画のチケットを購入した後、ユーザーはクエリの一部としてその特定の映画の名前を使用して、コンピューターデバイスに検索を実行させるかもしれない。
この特許のプロセスでは、その特定の映画のチケットがすでに購入されているという情報を含むコンテキストを取得することができる。
これに応答し、その特定の映画の名前を含む検索は、追加のチケットを購入する以外の目的を推測(例えば、他のコンピューターデバイスで実行されたユーザー主導のアクションを示すログデータに基づくなど)するかもしれない。
これにより、このシステムは、検索結果を調整し、その特定の映画の情報(例えば、レビュー、記念品、豆知識など)よりも、映画の上映時間の情報を下位にランク付けすることができる。
この特許の発案者は、コンテキストについての説明のために、なぜ映画を例に挙げたかを説明している。
映画のチケットを購入した後という現状で、検索者が探している可能性が高い情報を強調するように検索結果を自動的に調整することで、このシステムは検索者のストレスを軽減し、貴重な時間やリソースを無駄にしないようにすることができる。
(検索クエリに映画の名前を含めることで)検索結果の中から必要な情報を探す時間を短縮することができる。
また、この特許では、クエリ内のコンテキストに関わる情報を使用することで、検索の背後にあるインテントに基づいたより良い検索結果を返す手助けとなるが、個人を特定できる情報を検索結果に表示させないようにしている。
簡単な言葉に言い換えると、人々が望む情報を提供する、ということになる。
また、個人のプライバシーについても真剣に考えている。
例えば、ユーザーの位置情報は、そのデータを取得する際に(市区、郵便番号、州など)地理的な位置を一般するなどして、個人を特定できないような処理を行うことができる。
この特許は、下記にて参照することができる。
特定のコンテキストに対する検索者の意図の予測
発明者:ユー・ジン・リム、ジョセフ・リン、ユーリン・リアン、カーステン・ステインベック、ウェイ・ロー・ルー、ドン・ヒュー・キム、ジェームス・カンズ、ローレン・コエフニック、ミン・ヤン
譲受人: Google LLC
米国特許: 10,909,124
取得日: February 2, 2021
出願日: May 18, 2017
概要
一連のコンピューターデバイスによって実行された、ユーザー主導のアクションに基づいて、コンピューターデバイスから返された特定のクエリを用いた、検索意図を決定するコンピューターデバイスについての説明。
検索意図に基づき、少なくとも検索から得られた検索結果の特定の一部を、検索意図を満たす情報を強調するように、検索結果を調整する。
コンピューターシステムは、調整された検索結果を、コンピューターデバイスに送信する。
クエリを実行される際に考慮される可能性のある、コンテキストの情報の種類について、以下の情報が含まれる可能性をGoogleは示唆している。
検索者にとって有益で役に立つ情報を提供するクエリを予測するために、検索エンジンはどのようにしてコンテキストについての情報を活用しているのだろうか?
これが、この特許が示すポイントである。
予測モジュールは、機械学習モデル(例:ディープラーニングモデル)を実行し、検索クエリ(もしくは、検索クエリの一部)とコンテキストモジュールから受け取った現在のコンテキストを入力情報を受け取る。
機械学習モデルは、現在のコンテキストに対する検索クエリを使用した、検索意図の表示(ラベルや他の指標)をアウトプットとして生成する。
予測モジュールによって決定された検索意図は、事前に定義されているインテントのグループから選択されるかもしれない。
事前に定義されているインテントの例としては、交通機関や旅行に関するインテント(例:ライドシェア、フライトの状況、チケットの購入、スケジュールなど)、エンターテインメントに関連するインテント(映画のレビュー、上映時間、チケット購入、キャストメンバーの経歴、アルバムや曲のレビュー、アーティストの経歴、アーティストのツアー日程)などが挙げられる。
また、インテントに関連したスコアを決定することもある。
そのスコアについて、この特許では下記のように説明されている。
インテントのスコアは、インテントを満たす情報を得るために、現在のコンテキストに基づいた検索クエリを使用した検索を実行するにあたり、その確信の程度(例:確率やその他の可能性の程度)を示している。
もちろん、そのスコアで特定の閾値を満たすという表現をすることもできる。
そのスコアが十分に高くない場合、検索エンジンはそのインテントに基づく検索結果の調整を行わないかもしれない。
反対に、その閾値を超えていれば、該当のクエリのインテントの影響をより強くするかもしれない。
この特許では、検索者の状況に合わせたニーズや情報についてのニーズを満たす検索結果を提供するため、インテントをどのように活用するかについてを詳細に説明している。
過去、検索のエンジニアがインテントと検索についての記事を書いた際、彼らはインテントについて下記のように語っている。
インフォメーショナルのインテントでは、ピザの歴史やピザのレシピなど、クエリについての情報を返す検索結果を提供する。
コマーシャルのインテントでは、近くのピザ屋やピザの生地、ソース、オーブンなどを販売しているお店など、クエリに関連する何かを購入する方法を返す検索結果を提供する。
トランザクショナルのインテントでは、ピザのデリバリーの注文など、何らかのアクションを行うことができる検索結果を提供する。
ナビゲーショナルのインテントでは、検索者が過去に訪れたことがあるページや、存在を知っているページの検索結果を提供する。例えば、ドミノピザの発祥地や取締役の情報などが挙げられる。
まとめると、この特許は検索のコンテキストに着目しており、それに基づいて検索の背後にあるインテントを推測しようとするものである。
これにより、そのコンテキストに関連する情報を含むようにクエリを書き換えることも含まれる。
検索技術の中でも、特にパーソナライズの領域の話であったという印象です。パーソナライズと言えばDiscoverが真っ先に頭に浮かびましたが、通常の検索でもそのような体験を組み込もうとしているのかもしれません。ますます便利になるGoogleですが、Webサイト側としては少しでも有益な情報を提供するよう、日々精進していきたいものです。
この記事は、Search Engine Journal に掲載された「Google Patent: Rewriting Queries Based on Context to Meet Intent」を翻訳した内容です。
SEO最新情報やセミナー開催のお知らせなど、お役立ち情報を無料でお届けします。