ピックアップコラム
-
Pickup!
【2020年】SEO対策会社の特徴(費用)と今後
インデックスされることにより、はじめてGoogleにウェブページが認識されます。Googleにウェブページが認識されなければ、検索結果に表示されず、アクセスが増えることはありません。SEO対策を行ううえで非常に重要なインデックスについて解説します。
目次
インデックスは、Web制作者にとって「SEOの大前提」「SEOの第一歩」と例えられる存在です。なぜインデックスはそれほどまでにSEOにとって重要なのでしょうか?
インデックスとは、Googleクローラー(ウェブページを巡回し情報を収集してデータベースに登録するプログラム)がWebページを認識し、データベースに登録することを指します。
たとえWebサイトを公開してもインデックスされるまではGoogleはウェブページを認識していないため、検索結果ページに表示されません。
通常、ウェブページの新規作成や既存ページの更新を行うと、一定期間の後にGoogleクローラーがインデックスしてくれます。
ただし、「更新頻度が低い」または「内部リンクが少ない」などクローラーが巡回しにくいWebサイトの場合、インデックスが遅れることが多いようです。
クローラーは、アンカーテキストをはじめとする他ページに設置された「リンク」や所有者から通知された「サイトマップ」などを元にWebサイトに辿り着き、下記のようなプロセスを経て検索順位を決定します。
▼クローラーの働き
つまり、Googleのクローラーにインデックスされなければ検索表示の順位を競うランキングにエントリーすらされないばかりか、他に講じたSEO対策の全てがムダになってしまうのです。
ちなみに、GoogleクローラーへWebページの存在を伝えるアンカーテキストリンクの最適化については、下記の記事を参考にして下さい。
作成したWebページをインデックスさせることはSEOにおいて非常に重要ですが、インデックス数を増やすことを目的にWebページを作成するのは正しいのでしょうか。
結論から言うと、高品質コンテンツのインデックス数を増やすことはSEO効果の向上に役立ちますが、反対に低品質コンテンツのインデックス数ばかりが増えると評価を下げる要因になってしまいます。
特に、Googleがパンダアップデートを導入して以降はコンテンツの「数」より「質」が重視されるようになり、ユーザーファーストやコンテンツファーストといった考え方がSEOの主流となりました。
そのため、近年では低品質コンテンツによって意図的にインデックス数を増やしている大規模サイトより、質の高いコンテンツだけを扱っている小規模サイトの方が高く評価される傾向にあります。
また、パンダアップデートの内容や導入後のSEO対策については下記の記事で詳しく解説しています。
Googleスパム対策チームのリーダーとして知られるマット・カッツ(Matt Cutts)氏は、「インデックスが多ければ検索順位が有利になるのか?」という疑問について明解な回答を発信しています。
ここでは、Googleが公開している下記の動画を要約しつつ特筆すべきポイントをピックアップしてみました。
「ロングテールSEO」とは、統一されたテーマに基づいて異なる検索キーワードを使った良質コンテンツを増やす手法を指しています。異る検索クエリごとに集客が見込めるため、まずは質の高いコンテンツを作成したうえでインデックス数を増やすべきでしょう。
大量のページを一度に公開しても問題なくインデックスされるのか、この疑問についてGoogleのMatt Cutts氏は「20万ページをニュースアーカイブへ公開するケース」を例に挙げて解説しています。
こちらも、Googleが公開している動画の内容を要約しつつ注目すべきポイントをご紹介しましょう。
上記の情報から、大量のページを一度に公開しても問題なくインデックスされるが、段階的に公開するよりも時間がかかると解釈できます。
インデックス状況を確認する方法を2つ紹介します。その場で簡単に調べたい場合はGoogleの特殊検索を利用し、より正確かつ詳細に調べたい場合はSearch Consoleを利用するのがおすすめです。
ただし、以前は個別ページの確認方法として有効だった「info:」コマンドは2019年3月26日付けでサポートが終了していますので注意が必要です。
こちらは、「個別ページ」と「Webサイト全体」の両方に対して使えるうえ、簡単に確認できる便利な方法です。Googleの特殊検索機能を利用してインデックスを調べるためには、インデックスされているか確認したいURLの前に「site:」を付けて検索します。
上記の画像は「site:https://pecopla.net/web-column/index」というURLで実際に検索した画面です。インデックスされていない場合には、上画像のように表示されます。
一方、検索したURLのWebページが正常にインデックスされている場合は、下記の画像のように表示されます。
上記画像のように該当するWebページが検索結果に表示されれば、そのWebページは正常にインデックスされていると判断できます。
また、「site:」の後にドメイン名を入力して検索することで、サイト全体のおおよそのインデックス数が確認可能です。
ただし、こちらの方法はあくまで目安の数値となり、正確な数値ではないということを認識しておいてください。
正確なインデックス状況を調べるには、2018年8月に公開された新Google Search Consoleを使用します。2019年9月に完全廃止された旧バージョンと似たような機能ですが、インデックス状況の確認に加えインデックスされない原因の特定にも役立つのが特徴です。
サイト全体のインデックス数を確認したい場合は、Search Consoleにログインし、左メニューバーの「インデックス」をクリックしましょう。
すると、下記画像のように「カバレッジ」と「サイトマップ」の2つのプルダウンメニューが表示されるので、赤枠で囲ってある「カバレッジ」を選択します。
下記画像の画面が表示され「有効」という欄を確認することで、サイト全体のインデックス数が分かります。
一方、個別ページを確認したい場合は左メニューバーにある「URL検査」から、または直接ページ上部の検索ボックスに調べたいURLを入力しましょう。正常にインデックスされていれば、下記のような画面が表示されます。
「新しくなったSearch Consoleについて詳しく知りたい!」という方は、下記の記事をご覧下さい。
インデックスを早める方法を用いてもインデックスされない場合の原因は、主に5つ考えられます。インデックスされない場合、後述の5つの原因によるものでないか確認しましょう。
Googleのガイドラインに違反したコンテンツを含むウェブページはペナルティーを受ける可能性がありますが、ペナルティーを受けるとインデックスされないことや、一度インデックスされたウェブページのインデックスが削除されることがあります。
ブラックハットSEOでペナルティーを受ける可能性のあるSEO対策を行なっている場合には、注意が必要です。
robot.txtやmetaタグ(noindexなど)で設定することで、クローラーのサイトもしくはウェブページへの巡回を拒否することが可能です。
初期の状態で巡回を拒否する設定になっていることは考えにくいですが、複数人でサイトを管理している場合などに、誤ってnoindexにしてしまっているということが考えられます。巡回拒否設定になっていないか確認してみるとよいでしょう。
内容の酷似したウェブページが2つのURLで存在する場合、一方のウェブページがオリジナルコンテンツとしてインデックスされ、他方のウェブページはインデックスされません。通常の場合、他のウェブページのコンテンツをコピーしなければ問題はありません。
しかし、オリジナルコンテンツがコピーコンテンツと認識され、インデックスされない(インデックスから削除)ことがあります。
クロールの頻度はPageRankに依存し、PageRankが高いコンテンツを多く含むサイトのクローラーの巡回頻度は高く、ウェブページを新規作成した際に、インデックスされるのが早い傾向があります。
そのため、PageRankの低いサイトは以下のようなことが発生する可能性があるため注意が必要です。
PageRankが低いサイトのインデックスが済んでいないウェブページのコンテンツを、PageRankが高いサイトがコピーした場合、PageRankが高いサイトの方が、コピーコンテンツであるにも関わらず、先にインデックスされる可能性があります。
そしてPageRankの高いサイトのコピーコンテンツが先にインデックスされてしまうと、PageRankの低いサイトのオリジナルコンテンツが、コピーコンテンツとみなされてしまうという逆転の現象が発生してしまいます。
これが原因でインデックスされてないという可能性がございます。
カテゴリページなどの自動生成されるページはインデックスされないことがあります。なお、カテゴリページに関してはインデックスさせることにメリットもデメリットもあるので注意が必要です。
一般的には記事数が少ないカテゴリページはnoindexにしておき、記事数が増えたらインデックスさせましょう。記事数が少ない状態でインデックスさせる場合は、カテゴリページに個別ページと同程度のユニークテキストを追加することをおすすめします。
クローラーはハイパーリンクを辿ってウェブページを巡回していますが、作成して間もないサイトの場合、他のサイトからのハイパーリンクが張られておらず、クローラーがサイトに辿り着くのに時間がかかることがあります。インデックスを早めるためには、SNSなども併用しながら、自然リンクを集めるのが重要です。
一定時間が経てば、ウェブページは自動的にインデックスされますが、次の方法を利用することで、インデックスを早めることが可能です。
URL検査はインデックスを行なっているGoogleクローラーに、特定のウェブページもしくはウェブページの直接リンクを巡回するように要請することができる機能です。以前は「Fetch as Google」という名称でしたが、現在では「URL検索」と名前が変更されています。
URL検査を利用することで、新規作成した記事を条件によって5分以内にインデックスさせることも可能です。しかし使用回数に制限があり、クローラーが巡回したウェブページが必ずインデックスされるわけではないので、注意しましょう。
sitemap.xmlはサイトを構成するウェブページのURLや最終更新日などの要素をXMLタグでマークアップすることで、Googleにサイトのコンテンツの構成を伝えるファイルです。
sitemap.xmlを作成し、Search Consoleに登録しておくことで、効率的にクローラーがサイトを巡回することを可能にします。
サイトのウェブページの更新情報を配信するための技術であるRSSフィードも、インデックスを促進するのに有効です。RSSフィードは最近更新されたURLのみが登録され、検索エンジンのダウンロードがsitemap.xmlよりも高頻度のため、sitemap.xmlと併せて利用しましょう。
内部リンクを整備することで、より効率的にクローラーにサイト内のウェブページを巡回させることが可能です。クローラーはウェブページのリンクを辿りながらウェブページを巡回しています。そこで各ウェブページが内部リンクで繋がった状態にしておくことで、クローラーに内部リンクを辿らせ、一度に複数のウェブページをクローラーに巡回させることが可能です。
パンダアップデートによりコンテンツの質が重視されるようになったため、質の低いコンテンツでインデックス数を増やしても意味を成さなくなりましたが、高品質なウェブページが多くインデックスされているサイトは検索エンジンからの評価が高いです。
日頃から内部リンクでクローラーが巡回しやすいサイトにすると同時に、sitemap.xmlやRSSフィードなどを利用して、インデックスを促進しましょう。
受付時間:平日10:00~19:00(土・日・祝日を除く)