Googleゴーゴルが写す未来の画像検索とは?

公開日:2011/04/11

最終更新日:2024/03/18

ブログ

無料で資料をダウンロード

SEOサービスのご案内
専門のコンサルタントが貴社サイトのご要望・課題整理から施策の立案を行い、検索エンジンからの流入数向上を支援いたします。

無料ダウンロードする >>
昨年Googleが「Googleゴーグル」というカメラで撮影した画像を元に検索する技術サービスがリリースされたことを知っていることは、Googleマニアの方なら多くがご存じかもしれません。今回はそんなGoogleの新技術が目指す未来をGoogleの特許をベースに考察。– SEO Japan

Googleゴーグルでは、史跡、本、名刺、芸術作品、製品のラベル、ロゴ、そして、テキスト等の写真を撮影して、検索を行うことが出来る。ゴーグルは、光学式文字認識システムを利用し、イメージ内のテキストをウェブで検索可能なテキストに変換したり、バーコードを読んだり、同様のイメージを芸術作品や史跡のベータベース、そして、その他のデータベースの中から探し出す。Googleゴーグルを介して写真ベースのビジュアル検索がもたらす機能は奥が深く、私たちが知らないことはまだまだたくさんある。

今週公開されたグーグルの特許には、電話用のグーグルのビジュアル検索が進化した姿が描かれている。街で写真を撮ると、その写真には建物、道路標識、人の顔、車、その他の物体が映っているはずだ。その写真をクエリとして送信すると、検索エンジンはイメージを分解し、イメージ内の大半の物体に対する検索を行い、そして、すべてのパーツを基に混合した検索結果を提供してくれるようだ。

それではその特許を紹介しよう:

ビジュアルクエリの複数の領域に対する検索結果を提供するためのインターフェース
考案: David Petrou、Theodore Power
米国特許申請番号 20110035406
付与日: 2011年2月10日
申請日: 2010年8月4日

概要

写真、スクリーンショット、スキャンしたイメージ、あるいは動画のフレーム等のビジュアルクエリが、クライアントシステムからビジュアルクエリ検索システムに投稿される。検索システムは、このアイテムを多くの平行検索システムに送信することでビジュアルクエリを処理する。それぞれのシステムが特徴的なビジュアルクエリ検索プロセスを実装する。

複数の結果が平行検索システムから送られてくる。検索結果を利用して、インタラクティブな結果の文書が作成され、クライアントシステムに送信される。インタラクティブな結果の文書は、サブポーションに対するビジュアル識別子を少なくとも1つは持ち、当該のサブポーションの検索結果への選択可能なリンクを最低1つは掲載している。

ビジュアル識別子は、それぞれのサブポーションに関するバウンディングボックスの可能性もあれば、それぞれのサブポーションの上に表示される半透明のラベルの可能性もある。オプションとして、バウンディングボックスやラベルには結果のタイプごとに配色のコーディングが実施される。

同時に実行される検索のタイプを以下に挙げていく:

  • 顔認識検索
  • イメージ内のテキストに対する光学式文字認識検索
  • イメージ対用語の検索システム 物体認識を用いる
  • 製品認識検索 本やCD等の表紙の二次元のイメージおよび家具等の三次元のイメージを認識する
  • バーコード認識検索
  • 固有表現認識検索 特定の人物、場所、物事等の情報を提供する
  • 史跡認識検索 実際の史跡、さらに広告掲示板で宣伝されているイメージを認識する
  • 場所認識検索 GPSレシーバーのようなシステムから提供されるジオロケーションの情報の支援を受ける
  • 色認識検索
  • 同様のイメージ検索 クエリとして用いたイメージに似ているイメージを探す

ビジュアル検索から返される結果には、ウェブページへのリンク、製品の検索結果、イメージ、動画、グーグルマップの結果、そして、プレイスページ、ストリートビューのシーン等が含まれる可能性がある。

人物の検索は、検索を行う写真の特定のパーツを分類し、さらには検索を実行する前に選ばれたパーツに注釈を与える可能性もある。

この特許は、このシステムの仕組みを詳細に説明しているが、掲載されているイメージは、仕組みを理解する上で大いに役に立つ。

スポーツドリンクの箱の写真を撮り、その写真には飲料を説明するテキスト、ボトルを飲むセレブの姿、ボトルの大きなイメージ、そして、製品のロゴが掲載されているとする。

A screenshot from the patent showing an image of a box of a sports drink.

ビジュアル検索システムは、この箱を異なる領域に分離し、検索を実行する:

 the same image as above, but with diagonal lines indicating different sections of the box hat might be searched upon

イメージの結果はテキストにリンク、顔認識のリンク、物体認識のリンク、製品のリンク、そして、商標のリンクとして表示される。

 the same image, but with different sections with labels such as trademark search, product search, facial recognition link, image recognition link, and text link.

異なるタイプの結果の集まりが、製品マッチ、ロゴマッチ、顔認識マッチ、イメージマッチ、そして、ウェブ結果のようなカテゴリーに分類され、検索者に表示される可能性がある。顔認識マッチにおけるグーグルのビジュアル検索のセクションでは、興味深いことに、結果の中に「ソーシャルネットワークフレンド」と言う項目がある。これは恐らくプロフィールの写真やアバターとのマッチを示すのだろう。

A view of the different types of results that might be returned in response to the use of the image as a query, including products, logos, facial recognition, product and advertising matches, and web results.

Googleゴーグルを利用したことがあるなら、グーグルのビジュアル電話検索の機能が何となく分かるだろう。この特許は、検索の個別のタイプが合わせて提供される仕組みにも触れている。

今後、検索コンサルタントに、製品の箱や広告掲示板、そして、その他の野外の標識のデザインの仕事が依頼されるようになるのだろうか?


この記事は、SEO by the Seaに掲載された「The Future of Google’s Visual Phone Search?」を翻訳した内容です。

最終的にはここで書かれているレベルの検索技術まで進化するのでしょうかね。しかし書かれていること1つ1つは同じことをやろうとしている会社が多くありますし、そこまで新規性があるものなのか?という気がしなくもないのですが特許が取れてしまうものなのですね。どちらかというと、そっちに驚きました。。。しかし、最後の一文にあるように、モノのデザインにまで検索性が求められる時代が来るのでしょうか?!そこまでは流石に、、って感じですが、さてさてどうなっていくやら。 — SEO Japan

記事キーワード

  • Facebook
  • X
  • はてなブックマーク
  • pocket
  • LINE
  • URLをコピー
    URLをコピーしました!

編集者情報

  • X
  • Facebook

アイオイクス SEO Japan編集部

2002年設立から、20年以上に渡りSEOサービスを展開。支援会社は延べ2,000社を超える。SEO/CRO(コンバージョン最適化)を強みとするWebコンサルティング会社。日本初のSEO情報サイトであるSEO Japanを通じて、日本におけるSEOの普及に大きく貢献。

メディアTOPに戻る

RECRUIT

一緒に働く人が大事な今の時代だからこそ、実力のある会社で力をつけてほしい。
自分を成長させたい人、新しいチャレンジが好きな人は、いつでも歓迎します。