Google検索の仕組みはご存知ですか?
検索エンジンが、膨大な数のウェブサイトの中から、どのようにウェブページを発見して、検索順位を決定しているのか知らない方も多いと思います。
一般の検索ユーザーにとって、Google検索の仕組みに興味は無いかもしれません。でも、ウェブサイトを管理しているウェブマスターにとって、Google検索の仕組みをきちんと理解することは重要です。
この記事では、Google検索の仕組みについて解説します。
検索エンジンの役割
検索エンジンの役割は、ユーザーが入力した検索クエリに対して最もユーザーの役に立つウェブサイトを検索結果の上位に表示し、検索したユーザーに対して満足する検索結果を提供することです。
Googleはユーザーの検索意図を的確に捉え、ユーザーの検索クエリに一致するウェブサイトを検索結果に返すことを追求しています。
例えば、悩みや疑問を解決したいと思っている検索ユーザーがいるとします。Google検索に検索クエリを入れて検索したにも関わらず、検索結果に悩みや疑問を解決できるウェブサイトが1件も表示されなかったら、ユーザーはGoogle検索を使わなくなってしまいます。
検索ユーザーにとって有益な情報が検索結果の上位にあることが当たり前になっていますので、Googleは様々なアルゴリズムを用いて、ユーザーの検索意図を理解しようと努力しています。
Google検索の仕組み
検索ユーザーにとって役に立つウェブサイトが上位表示されるために、検索エンジンは、インターネット上にあるウェブサイトの中身について理解しなければなりません。
そのために、Googleでは、クローラーと呼ばれるウェブクロール用のソフトウェアを使って、ウェブページを発見して、ウェブページの内容を理解しています。最もよく知られたクローラーはGooglebotですね。
では、Googlebotが、ウェブページをどのように発見して、理解するのかを見ていきましょう。Google検索エンジンでは、以下の4つのステップを行っています。
- 発見
- クロール
- インデックス
- ランク
1. 発見
インターネット上に、どんなページがあるのかを発見します。この段階では、URLを発見するだけです。ディスカバーとも言われています。
2. クロール
クロールはウェブサイトの内容を理解する上で非常に重要なステップです。
クローラーは、検索ユーザーが実際にウェブサイトを見るのと同じように、実際にアクセスしてウェブサイト上のリンクを訪れます。クローラーは、リンクからリンクに飛んでいきます。発見したURLがどんなページなのか読み取りながら、ウェブサイトの情報をデータベースへ運んでいくのです。
ちなみに、検索エンジンがクロールリクエストを送り過ぎると、相手のサーバーがパンクしてしまうので、Google側でクロールの頻度は最適化されています。突然1万ページあるウェブサイトを公開したとしても、1万ページすべてがクロールされることはありません。Googlebotが重要そうなページのあたりをつけて、徐々にクロールされていくことになります。
どのサイトをクロールし、各サイトからどのくらいの頻度で、どのくらいのページを取得するかは、コンピュータ プログラムが決定します。Google では、サイトをクロールする頻度を上げる目的での金銭の支払いを受け付けていません。Google が目指しているのは、最適な検索結果を提供することだからです。
3. インデックス
クローラーが運んできたウェブサイトのコンテンツを分析して理解することで、コンテンツに索引をつけながら、検索エンジンのデータベースに登録することをインデックスといいます。
Googleのサイトによると、Googleのインデックスは1億バイトを超えています。
基本的に、Google では、クロール時にページの情報を収集した後、インデックスを作成することで、検索対象の正確な場所を把握します。本の巻末に収載されている索引と同様に、Google のインデックスには、単語と単語が使われていたページに関する情報が含まれています。
4. ランク
ウェブページがクロールされ、インデックスが完了すると、ようやくランクがつけられます。
逆に、インデックスされていないウェブページは、検索結果に表示されることはありません。
検索エンジンが重視していることは、ユーザーが投げたクエリに対して、一番マッチするウェブサイトを、検索結果の上位に表示することです。
現在のGoogle検索では、検索クエリだけではなく、コンテキストを理解して、コンテキストに合った検索結果を出すようになっています。
「犬」を検索する場合、必要なのは「犬」という単語が何百回も出現するページではありません。おそらく求められているのは、写真や動画、または犬の種類の一覧表などでしょう。Google のインデックス登録システムでは、公開された時期、写真や動画の有無など、ページのさまざまな特性に着目します。Google では、ナレッジ グラフによって、目的の人、場所、物をもっとよく把握できるように、単なるキーワード マッチング以上のことに日々取り組んでいます。
ランキングアルゴリズム
ランキングアルゴリズムは、200以上のシグナルに基づいています。
ユーザーが検索クエリを入力すると、インデックスで一致するページが検索され、関連性が高いと判断された検索結果が返されます。ページの関連性は、200 以上もの要素によって判断されます。Google では、アルゴリズムの向上に常に取り組んでいます。
ランキングアルゴリズムの例は、以前Googleのサイトに掲載されていましたが、今の時点でページはなくなってしまいました。参考までに紹介します。
- ウェブサイトのコンテンツのデータ鮮度
- 特定のサイトにリンクしている他のウェブサイトの数とそのリンクの権限
- ウェブページ上の語句
- 検索キーワードの同義語
- スペルチェック
- サイト上のコンテンツの質
- ウェブページの URLとタイトル
- 最適な結果の種類は何か(ウェブページ、画像、動画、ニュース記事、パーソナル検索結果など)
- カスタマイズ
- そのユーザーとつながっている人がすすめている結果
ランキングアルゴリズムは毎日進化している
Googleは、検索結果の品質を向上させるために、ランキングアルゴリズムに毎年500件以上の改良を加えながら、調整しています。
2017年10月、ユーザーの現在地に基づいて、関連性の高い検索結果が表示されるようになりました。
Google では、検索されたキーワードに対して、最も役に立つ検索結果を表示できるように努めています。現在、Google で検索される約 5 分の1 は、ある場所についての情報だったり、場所に紐づく情報です。そのため、お使いのエリアに関連性の高い検索結果を表示することは、より正確で、役立つ情報をお返しする上で非常に重要だと考えています。
コア アルゴリズムの更新
年に数回、Google検索はコア アルゴリズムの更新を行います。
「Googleの使命」を理解する
「Googleの使命」はご存知ですか?
Google の使命は、世界中の情報を整理し、世界中の人々がアクセスできて使えるようにすることです。
ユーザーのインターネットの利用方法は日々変化しており、ユーザーの検索ニーズも時代の変化により変化していきます。
Googleは、「Googleの使命」を実現するために、様々なアルゴリズムやテクノロジーを使って検索エンジンを改良し、ユーザーの検索意図を的確に捉え、検索ユーザーが「良質な情報」や「役に立つコンテンツ」にアクセスできるようアルゴリズムを更新しています。
さいごに
Google検索の仕組みについて解説しました。
検索エンジンが、コンテンツをユーザーに届けるまでのステップがお分かりいただけたと思います。クロール、インデックス、ランクについても理解できたのではないでしょうか。
Google検索に興味のある方は、「検索エンジン最適化(SEO)スターター ガイド」や「検索品質評価ガイドライン」についても知っておくことをオススメします。
ナレッジ