検索ロボットの種類っていくつあるの?

起業家のためのGoogle Search Console

前回は「検索を知れば百戦危うからず」と題して、

検索エンジンは色々あるわけですが当ブログではGoogleにフォーカスして解説していきますが、Yahoo!なんかも2010年からGoogleの検索エンジンを使っているので日本における検索エンジンはほぼGoogleの検索エンジンだと考えて差し支えないです。

皆さんもご存じの検索エンジンは、調べたいキーワードから検索できる仕組みやサイトを指しますが検索エンジンにはロボット型というのとディレクトリ型があって、Googleは全文検索のできるロボット型を採用しています。

2010年以前のYahoo!JAPANなんかでは人力のディレクトリ型が採用されていましたが、これだけ情報量が溢れてくると人力では限界なんでしょうね。

しかし、Googleはロボット型検索エンジンを採用していますが、ペナルティに関しては人力で行われているようです。

では、検索エンジンは何を読んでいるのでしょうか?

WEBサイトにはテキストベースであったり、画像や動画など様々なコンテンツがあって検索ロボットはこれらのコンテンツを読み込んでいきます。

少し前まではテキスト要素をインデックスしていたものを今では技術革新によって音声データや動画のコンテンツをテキストデータ化してインデックスすることができるようになっています。

写真でも人の画像であれば、それを人として認識できる仕組みが採用されていますし、カメラ機能で顔が表示されると追尾でフォーカスされる仕組みがあると思いますが、あれと同じような仕組みが採用されているのです。

この機能によってGoogleのフォトなどでは写真をアップすると同じ顔の人物を見分けたりタグがつけられるようになっていて、これらも検索エンジンが認識していることを示しています。

Googleマップでも同じようにエリアの写真をアップすることができて、その場所を示すエリアデータは当然として写真に掲載されている情報や撮影された日時などもデータとして取り込んでいるのです。

というわけで、検索ロボットの概要については共有できたと思いますので次回は、そのアルゴリズムやページランク、ドメインエイジを解説していきます。