検索エンジンにおけるアルゴリズムは、日本語で「演算法」や「算法」と呼ばれています。

特定の課題を解決するための計算方法や処理方法などを示すもので、これらの答えを導き出すための手順、方法を明確にしたものです。

何かの作業や問題を解決するためのルールですが、検索アルゴリズムはどのような内容でルールが決められているのでしょうか?

この記事では、Googleの検索アルゴリズムの仕組みや決める要因などについて解説します。

 

 

検索アルゴリズムとは?

 

そもそも、検索アルゴリズムとはどのようなものでしょうか?

アルゴリズムという言葉で意識したことがないかもしれませんが、実際は私たちの身近なものにも存在しているのです。

例として、ハンバーガーを作る工程をアルゴリズムに例えてみましょう。

ハンバーガーを作る際に必要な材料としてバンズ、野菜、パティがあります。

これらの食材を切ったり、焼いたりした後にバンズに挟んで調味料を付けて盛り付けます。

このような段階ごとの作業手順がアルゴリズムということです。

ただし、作業の手順を短縮できるようにする人もいれば、手順が悪くて作業に時間がかかる人もいるでしょう。

このような部分がアルゴリズムのデータ処理速度になる部分と考えるとわかりやすくなります。

 

 

Googleの検索アルゴリズムはどうなっている?

 

Googleの検索アルゴリズムは、一般的なアルゴリズムと比較してどうなっているのでしょうか?

Googleの場合、ユーザーが入力した検索キーワードを膨大なページの中から探し出し、さらに関連性の高いものを瞬時に選んで表示します。

どのサイトを検索結果の何番目に出すかを決めるために、ユーザーの情報などに基づいて適した検索結果が反映されるようになっているのです。

Googleでは、様々な要素やシグナルを検討する自動ランキングシステムを採用していて、最も関連性の高い結果が表示されるようにしています。

厳格な評価によって定期的に改善されているので、アルゴリズムを理解するとどのような情報が検索結果の上位になるかが理解しやすいでしょう。

 

 

知っておきたい検索アルゴリズムの仕組みは?

 

検索アルゴリズムの仕組みは、約5つのステップに分かれています。

ここでは、その仕組みを簡単に解説していきます。

 

 

クローラーでの収集

 

クローラーと呼ばれる自動プログラムを使って、ウェブ上にどのようなページが存在しているかを把握します。

蜘蛛の巣を張り巡らすようにウェブサイトを隅々まで探索し、新しいページや更新されているページを見つけます。

ウェブページのコンテンツ以外にもリンク情報なども集めて、これらの情報をウェブページの評価や検索結果に表示します。

 

 

解析

 

クローラーによって集められたウェブページのコンテンツは、レンダリングと解析が行われます。

解析では、HTML、CSSなどのコード解釈も行い、ページの構造に加えて内容も理解していきます。

これによって得たデータは、インデックスに格納される仕組みです。

レンダリングは、ウェブページを表示するのと同じようにコードを実行し、ページの見た目についても理解します。

解析することで、ユーザーがブラウザでページを見たのと同じように内容を理解できる仕組みです。

 

 

データベース登録

 

レンダリングと解析が行われたら、次には検索エンジンの各ウェブページでコンテンツのインデックスが行われます。

インデックスはデータベースへの登録となり、ここにはタイトル、見出し、本文、画像テキスト、メタデータなどの情報が含まれるのです。

検索エンジンの図書館のような存在とイメージするとわかりやすいでしょう。

これらの情報は、検索キーワードとの関連性についても分析して結果の表示に使われます。

そのため、データベースへの登録は検索エンジンに認識されて、検索結果に表示されるためには欠かせないものでしょう。

 

 

分析

 

登録された情報は、キーワードとの関連性に関しても分析が行われます。

どのページがどのようなキーワードに関係しているかを判断して、関連性の強さについて検索エンジンが評価するからです。

この分析はページ内のテキストだけでなく、タイトル、見出し、リンク情報、メタデータなども考慮されたものとなり、自然言語処理技術を用いてキーワードとなる言葉の意味から文脈まで理解します。

ここまで分析することで、より高度な関連性の有無を判断するということです。

 

 

結果表示

 

検索エンジンはユーザーがキーワードを入力することで、インデックスからキーワードに最も関連するページを結果として表示します。

関連性の高さや強さに加えて、ページの質、ユーザーの検索履歴、位置情報などの要素も踏まえて検索結果の順位を決めていくのです。

Googleの検索アルゴリズムにおいては、日々進化しているためユーザーが今知りたい情報を提供できるように改善されています。

 

 

アルゴリズムはアップデートでも変わる!?

 

一般的な検索アルゴリズムは上記のような仕組みになっていますが、Googleは定期的に検索アルゴリズムをアップデートしています。

そこで、今までGoogleが実施してきたアルゴリズムのアップデートについてみていきましょう。

 

 

パンダアップデート

 

2011年にGoogleが行ったのがパンダアップデートです。

これは、コンテンツの内容を重視したアップデートであり、質の低いコンテンツの検索順位を下げるものです。

実施前には、コンテンツの内容よりもサイトのコンテンツ量やドメインなどの評価を重点的に行っていたため、他のサイトからのコピーや内容の薄いコンテンツなども上位に来てしまいました。

ユーザーにしてみると、有益でないコンテンツが上位になっているため、満足度が低下します。

それを鑑みてアルゴリズムの更新がされました。

 

 

フレッシュネスアップデート

 

フレッシュネスアップデートでは、より最新の情報が検索結果に表示されるアップデートです。

これによって、全体の約35%のサイトが影響を受けたとされています。

 

 

ペンギンアップデート

 

2012年に行われたのがペンギンアップデートです。

パンダアップデートは、コンテンツの中身を評価基準にしたことに対してペンギンアップデートでは被リンクの評価基準を見直すものでした。

2012年以降は、被リンク数の多さで上位に表示されやすいアルゴリズムとなっていましたが、その隙間を縫って悪質な自作自演リンクを大量に貼る行為が増えてしまったのです。

このようなスパム行為を受けたことがきっかけで、Googleでは質の低いリンクが貼られているサイトの順位を大幅に下げるアップデートを行いました。

ペンギンアップデートに関しては数回にわたって行われ、自作自演の低いリンクを大量に貼りつけていると判断された場合は、サイトが検索エンジンから出されるケースもありました。

ここで受けた対応は、非常に重いペナルティとなっています。

 

 

パイレーツアップデート

 

パイレーツアップデートでは、著作権の侵害が行われているコンテンツが多いサイトを上位表示しないものです。

デジタルミレニアム法案を基準にしたもので、違反するコンテンツの検索順位を下げて違反していないサイトの評価を上げました。

 

 

ペイデイローンアップデート

 

ペイデイローンアップデートでは、金融系、ポルノ系、ギャンブル系のキーワードで上位表示のために多用していたサイトの評価を下げるものです。

「Payday Loan(即日ローン)」などのキーワードを対象にしていたことからこの呼び方がされています。

 

 

ハミングバードアップデート

 

2013年9月に検索アルゴリズムのハミングバードを導入しています。

これは、会話からの検索に対して適切で関連性の高いコンテンツを上位に表示するものです。

ハミングバード導入前は、アルゴリズムが読み取れる内容しかできず、検索において面倒に感じた部分もあったでしょう。

しかし、ハミングバード導入によって会話型の認知制度が良くなったことで検索結果が表示できるようになりました。

 

 

ベニスアップデート

 

ベニスアップデートでは、位置情報によってユーザーに適した検索結果が表示されるようになりました。

エリアと結びつきの強いキーワードとして美容院、レストラン、スーパーなどがあります。

アップデートによって近くのレストラン、近くの美容院などの検索がしやすくなりました。

 

 

クオリティアップデート

 

今までに加えて質の高いコンテンツをより評価するアップデートとなります。

パンダアップデートと似ていると感じるかもしれませんが、クオリティアップデートでは全てのページを対象にしてアルゴリズム全体のアップデートがされました。

 

 

Rank Brain

 

2015年のRank Brainは、コンテンツと検索キーワードの関連性を判断するための人工知能が搭載されました。

これによって、より検索キーワードの意味を理解した検索結果が表示されるようになっています。

 

 

モバイルフレンドリーアップデート

 

スマホの普及によって検索ユーザーが増加したことから、モバイルで最適化しているページを上位に表示させるようにしました。

このアップデートでモバイル検索の場合は、それに適したサイトにアクセスしやすくなりました。

 

 

インタースティシャルアップデート

 

インタースティシャルアップデートは、サイトを訪れた際に画面いっぱいに広がる広告について検索順位を下げるアップデートです。

画面いっぱいになる広告は、本来ページ上にあるコンテンツが隠されてしまうだけでなく、ユーザーには不便しか感じません。

このようなページが上位に表示されないようなアップデートということです。

 

 

アウルアップデート

 

アウルアップデートは、フェイクニュースが上位に表示されないためのアップデートです。

アップデート以前は、Googleの検索結果に事実とは違う情報が上位に表示されてしまい、偽物の情報を目にする機会も多くありました。

Googleはこの問題に対応するために、信ぴょう性の低いコンテンツを上位表示させないようにしています。

 

 

コアアルゴリズムアップデート

 

コアアルゴリズムアップデートは、定期的に行う大幅なアップデートです。

年に数回実施されていて、事前の告知や内容などは発表されません。

 

 

 

ここまで検索アルゴリズムについて解説してきました。

検索エンジンにおいてのアルゴリズムは仕組みやルールが決まっていて、それに従って変わっていきます。

常に最新の情報に上書きされ、ユーザーにおいて使いやすい状態が保たれているということです。

特にSEOで結果を出すにはアルゴリズムへの理解が必要でしょう。