SEOの最重要特許ベスト10 その8 – ウェブページと地理の深い関係

公開日:2012/04/03

最終更新日:2024/02/17

ブログ

久しぶりのSEOの再重要特許シリーズを。検索エンジンがウェブページの言語を認識しているであろうことは、なんとなく皆さん分かっているとは思いますが、Googleはウェブページの地理情報まで認識しようとしていることはご存じですか?今回はそんな検索エンジンの持つ高度な地理情報の認識技術について紹介します。 — SEO Japan

ウェブサイトのページはその他のページのランキングにどの程度影響を与えるのだろうか?2005年に私が広告代理店で仕事をしていた時、この会社は個別のページのランキングに焦点を絞る戦略が取られていた – 特定の用語およびフレーズに対してコンテンツを最適化して、サイトの内外を含むその他のページからリンクを確実に導く取り組みが行われていた。私はこのルールだけでは満足することが出来なかった。ウェブサイトの全体的な問題を無視して、個別のページで用語に対する最適化を行うのは不可能だった。サイトの全てのページは、検索エンジンがクロール、インデックス、そして、表示する仕組みに影響を与えることが出来るのだ。

例えば、サイトのホームページが複数のURLでアクセスすることが出来る場合、次のように当該のページのページランクが分割されてしまうリスクが生じる:

  • https://www.example.com/
  • https://example.com/
  • https://www.example.com/index.htm
  • https://example.com/index.htm
  • https://www.example.com/Index.htm
  • https://example.com/Index.htm

ウェブサイトのページが[www]なしでも有りでもアクセスすることが可能なら、検索エンジンはそのサイトの全てのページをあり/なしの2回に分けてインデックスし、ページランクを分け合う可能性もある。ニューヨークタイムズのホームページにおいては、数年間に渡り、「https://www.nytimes.com」版ではグーグルツールバー内のページランクは9あるにも関わらず、「https://nytimes.com」版では7が表示されていた。

サイトのグローバルな問題を無視するとこのような問題が発生する可能性がある。しかし、サイトのその他のページおよび個別のページに対する影響に注目するメリットは他にもある。あるページへ別のページからリンクを張る際に、意味のあるアンカーテキストを選ぶ作業が良い例である。その他にも2005年に公表された特許は、用語がページに表示されていなくても、同じサイトの別のページに表示されている限りは、地理的に関連する用語に対するインパクトがあると指摘している。

ウェブページに地理的な識別子を割り当てる

ラーズとジェンズのラスムセン兄弟がオーストラリアで運営していた企業、Where 2 Technologiesを2004年10月にグーグルに売却した後、グーグルマップの作成を担当するチームに彼らは所属した。ラスムセン兄弟は、グーグルがウェブページ上の地理的な場所を処理するプロセスにも取り掛かった。彼らは、地理的な情報をウェブページに割り当てるプロセスを説明する以下の特許を作成した。

地理的な場所の識別子をウェブページに割り当てる
発明: ラーズ・エイルストラプ・ラスムセン & ジェンス・エイルストラプ・ラスムセン
米国特許申請番号:
公表日: 2005年8月18日
申請日: 2004年11月26日

概要

一連のウェブ文書の特定を含む可能性のある、地理的な情報の識別子をウェブ文書に割り当てるシステムおよびメソッド。一連のウェブ文書の1つ目のウェブ文書内に含まれる地理的な場所の識別子が特定されると推測される。特定された地理的な場所の識別子は、1つ目のウェブ文書と2つ目のウェブ文書の関連性に応じて、一連のウェブ文書の2つ目の文書に割り当てられると考えられる。

この特許は、検索エンジンがウェブページ上で場所の情報を探し、地理的な情報を含む場所をページに割り当て、次に場所を当該のページに“関連する”ページに割り当てると推測される仕組みを説明している。

この特許が解決を試みていた問題点は、キーワードベースの検索エンジン(当時のグーグル、そして、その面影は今でも十分に残っている)が以下の作業を行う際にウェブページを地理的に特定することが出来ない点である:

  • 検索エンジンによるページに対する場所の意図的な割り当て
  • サイトの持ち主によるページに対する場所の意図的な割り当て
  • 地理的なメタタグの利用
  • キーワードと同じページに表示されている郵便番号を確認した際の検索エンジンによる場所の割り当て

地理的な場所の識別子の割り当て

特許の申請書で描かれているプロセスでは、ページ上の地理的な場所の識別子は、関連性の要因が考慮された後、地理的な識別子を持っている持っていないに関わらず、その他のページに割り振られ、場所の情報を持たないページが地理ベースの検索でもリストアップされるように工夫されている。関連性の要因を以下に挙げていく:

  • 文書の間の相対距離
  • 利用されている用語
  • ページが同じサイトに掲載されているかどうか

この特許は、以下のような複数の地理的な場所の識別子を挙げている:

  1. 住所およびその一部
  2. 電話番号
  3. 局番
  4. 空港コード
  5. 史跡の識別子
  6. 経度や緯度等の物理的な場所に関連するデータ
  7. 場所に関する情報を持つページに関連すると思われる地理情報を持っていないページ同士のハイパーリンク

また、ディレクトリ等のその他の文書は、場所の識別子を割り当てる上で役に立つ可能性があるとこの特許は指摘している。さらに、検索エンジンは、ページ上のテキストを精査して、住所や場所を説明するその他の情報に対する標準的な形式を探し出すパターンマッチングのアプローチを採用することもあり得るようだ。

このプロセスは、ページが何かしらの場所に関する情報を持っている場合、その場所に関連していると仮定する。

この仮定に従い、その他のページが当該のページから特定のクリック数でアクセスすることが出来るなら、1つ目のページに“関連”していることを条件に、その場所への関連性があると推測される。

地理的に関連するページ

地理的に関連する文書は、次のケースに当てはまる場合、関連性があると認められる可能性がある

  1. 同じウェブサイトに所属する場合
  2. 別のページへ導くページ上にある場所の情報を含むアンカーテキストが、一連の小規模な規則に基づく用語を1つ、または複数含む場合

関連する用語は次のような用語を含むと推測される:

  • Location(場所)
  • Dicetion(方角)
  • Find(見つける)
  • Finder(発見した人)
  • Locate(位置付ける)
  • Locater(位置を決める)
  • Store(店)
  • Branch(支店)
  • About(紹介)
  • Company(会社)
  • Contact(連絡先)
  • Information(情報)
  • その他

また、アンカーテキストに住所の一部または全てが含まれている場合、ページが場所に関連すると考慮するアプローチもある。

イメージ、動画、またはその他のテキスト以外のアンカーにおいては、リンクを張られたページは、リンク内のURLが住所の一部または全部、もしくは、上記の関連する用語のいずれかを含む場合、関連すると考慮される可能性がある。

また、ページのコンテンツを直接精査することで、関連性が検討される可能性もある。

このような関連する用語を持たないリンクでも、HTMLの<title>に上記の関連する用語のいずれか、もしくは郵便番号の一部または全てが含まれている場合、関連性があると考えられる。

地理的に重要なクリックの距離

地理的に関連するページの候補が特定されると、今度は場所の情報を持つページから複数のリンクで結ばれているページが注目される。この特許は、このクリックの距離を2-5本のリンクの範囲と示唆している。これ以上距離が離れると、そのページは地理的に関連するとは見なされないと推測される。

場所の情報が掲載されたページからリンクが張られたページに加え、このプロセスは、当該のページにリンクを張っているページにも注目する。従って、サイト上のあるページが「Direction」のような地理に関連する用語をアンカーテキストで使っていない場合でも、使っているページにリンクを張っている場合は、(場所が欠けている)リンクを張っているページにも、リンクが張られたページ内で見つかった場所が割り当てられる可能性がある。

全てのページを確認した結果に応じて、ページごとに異なる地理の関連性の仮定が存在する可能性はある。関連するリンクおよびリンクの距離が、地理的な場所の情報を含まないページに対して計算されると考えられる。これらのページはそれぞれ距離に応じて関連度の度合いを見極め、この度合いは全ての地理的な情報を含む可能性のある周りのページに加えられると推測される。つまり、ページが関連するアンカーテキストまたはURLを利用する複数のページからリンクを張られる/~にリンクを張る場合、その他のページよりも当該の地理的な情報に対して関連性が高いと特定されることもあり得るのだ。

また、単一のページに複数の場所が関連している可能性もある。

教訓

この特許が申請されたのは8年前だが、未だに米国特許商標局では審査をしており、付与されない可能性もある。

しかし、この特許で描かれているコンセプトの多くは、審査中だった頃に私が取り上げた特許「ウェブサイトのページ等、関連するウェブページの間で情報を広める」に反映されている。この特許は、地理的な関連性を割り当てる作業のコンセプトを含んでいたが、あるページから別のページへのその他の用語やコンセプトにまで関連性を割り当てる範囲を拡大している。この特許については、「グーグル、検索オーソリティーのページを特定し、オーソリティを関連するページに広める」の中で説明している。

あるページの“関連性”が地理的な場所以外の背景で別のページへと割り当てられる仕組みを説明する部分をこの投稿から引用する:

場所の情報以外にも、別のページへと広められる情報が存在する可能性はある。「pho」(牛ベースの麺料理)を含むレストランのメニューを含むページを例にとって考えてみよう。

phoは、ウェブページの多様なウェブページの集まりにおいて頻繁に利用されるわけではないため、記述的な用語だと考えられる。

用語「pho」は特定され、サイトのホームページにまで広められ、このワードは実際にはホームページには登場しないもののホームページに掲載されているように扱われる可能性がある。次に、カリフォルニア州に住む人が「pho restaurants」で検索を行ったと仮定してもらおう。すると、このホームページには「pho」も場所も言及されていないにも関わらず、関連性が一致したページとしてリストアップされることもあり得るのだ。

あるページが別のページのランキングにどのくらい影響を与えるのだろうか?

場合によっては、多数の影響力を持つ可能性がある。

注記: 会社の場所に関する情報は非常に重要である。実際に足を運んでもらいたい店舗やオフィスを持っているなら、もしくは特定の地域の人達にサービスを提供しているなら、検索エンジンにインデックスしてもらいたい住所をサイトの全てのページに掲載することを薦める。グーグルが、地理的な関連性をこの特許で描かれている方法で割り振っている可能性はあるが、自分で賢明な取り組みを行うことで、検索エンジンが容易に仕事を実行できる環境を作り出すことが出来るはずだ。


この記事は、SEO by the Seaに掲載された「10 Most Important SEO Patents: Part 8 – Assigning Geographic Relevance to Web Pages」を翻訳した内容です。

なるほど、単純に言語やサーバーのロケーションで判断しているレベルの話じゃないのですね。ページ上の情報からある程度推測しつつ、関連リンクとの関係性の中で判断していく、と。実際にどこまで適応されているかは分かりませんが、地図検索はもちろん、今後のローカル検索の発展にもGoogleが重要視しているエリアだけにこの技術が活かされていく範囲は多そうです。 — SEO Japan

記事キーワード

  • Facebook
  • X
  • はてなブックマーク
  • pocket
  • LINE
  • URLをコピー
    URLをコピーしました!

編集者情報

  • X
  • Facebook

アイオイクス SEO Japan編集部

2002年設立から、20年以上に渡りSEOサービスを展開。支援会社は延べ2,000社を超える。SEO/CRO(コンバージョン最適化)を強みとするWebコンサルティング会社。日本初のSEO情報サイトであるSEO Japanを通じて、日本におけるSEOの普及に大きく貢献。

メディアTOPに戻る

RECRUIT

一緒に働く人が大事な今の時代だからこそ、実力のある会社で力をつけてほしい。
自分を成長させたい人、新しいチャレンジが好きな人は、いつでも歓迎します。