【SEOの基本】インデックスとは?順位への影響・確認方法・インデックスされない原因

SEO対策実例・コラム
2020.02.28
【SEO基礎知識】インデックスとは?影響・確認方法・インデックスされない原因は?

インデックスされることにより、はじめてGoogleにウェブページが認識されます。Googleにウェブページが認識されなければ、検索結果に表示されず、アクセスが増えることはありません。SEO対策を行ううえで非常に重要なインデックスについて解説します。

インデックスとSEOの関係とは?

インデックスは、Web制作者にとって「SEOの大前提」「SEOの第一歩」と例えられる存在です。なぜインデックスはそれほどまでにSEOにとって重要なのでしょうか?

インデックスとは?

インデックスとは、Googleクローラー(ウェブページを巡回し情報を収集してデータベースに登録するプログラム)がWebページを認識し、データベースに登録することを指します。

たとえWebサイトを公開してもインデックスされるまではGoogleはウェブページを認識していないため、検索結果ページに表示されません。

通常、ウェブページの新規作成や既存ページの更新を行うと、一定期間の後にGoogleクローラーがインデックスしてくれます。

ただし、「更新頻度が低い」または「内部リンクが少ない」などクローラーが巡回しにくいWebサイトの場合、インデックスが遅れることが多いようです。

インデックスから検索順位が決まるまでの仕組み

クローラーは、アンカーテキストをはじめとする他ページに設置された「リンク」や所有者から通知された「サイトマップ」などを元にWebサイトに辿り着き、下記のようなプロセスを経て検索順位を決定します。

▼クローラーの働き

  • Webサイト内をクロール(巡回)し、データを収集する
  • インデクサプログラムによって収集したデータを検索しやすい状態に処理して登録する
  • ユーザーの検索ワードとインデックスしたデータをマッチングする
  • 検索ワードに対し関連性と評価の両方が高いコンテンツから上位に表示させる

つまり、Googleのクローラーにインデックスされなければ検索表示の順位を競うランキングにエントリーすらされないばかりか、他に講じたSEO対策の全てがムダになってしまうのです。

ちなみに、GoogleクローラーへWebページの存在を伝えるアンカーテキストリンクの最適化については、下記の記事を参考にして下さい。

アンカーテキストとは?SEO上の効果・注意点・確認方法を解説

インデックス数は検索順位に影響する?

作成したWebページをインデックスさせることはSEOにおいて非常に重要ですが、インデックス数を増やすことを目的にWebページを作成するのは正しいのでしょうか。

「インデックスの数」より「コンテンツの質」が重要

結論から言うと、高品質コンテンツのインデックス数を増やすことはSEO効果の向上に役立ちますが、反対に低品質コンテンツのインデックス数ばかりが増えると評価を下げる要因になってしまいます。

特に、Googleがパンダアップデートを導入して以降はコンテンツの「数」より「質」が重視されるようになり、ユーザーファーストやコンテンツファーストといった考え方がSEOの主流となりました。

そのため、近年では低品質コンテンツによって意図的にインデックス数を増やしている大規模サイトより、質の高いコンテンツだけを扱っている小規模サイトの方が高く評価される傾向にあります。

また、パンダアップデートの内容や導入後のSEO対策については下記の記事で詳しく解説しています。

パンダアップデートとは?ペナルティの具体例とGoogleに好かれるSEO対策

Googleがインデックス数について言及

Googleスパム対策チームのリーダーとして知られるマット・カッツ(Matt Cutts)氏は、「インデックスが多ければ検索順位が有利になるのか?」という疑問について明解な回答を発信しています。

ここでは、Googleが公開している下記の動画を要約しつつ特筆すべきポイントをピックアップしてみました。

  • インデックス数が多いからといって検索順位は自動的に上がらない
  • 闇雲にページ数を増やすだけでは、サイトの評価も検索順位も向上しない
  • ただし、良質なコンテンツが多ければ各ページにリンクが集まりページランクも上がる
  • ランキング付けされる機会を増やしたいなら「ロングテールSEO」が効果的

「ロングテールSEO」とは、統一されたテーマに基づいて異なる検索キーワードを使った良質コンテンツを増やす手法を指しています。異る検索クエリごとに集客が見込めるため、まずは質の高いコンテンツを作成したうえでインデックス数を増やすべきでしょう。

大量のページはまとめて公開?それとも段階的?

大量のページを一度に公開しても問題なくインデックスされるのか、この疑問についてGoogleのMatt Cutts氏は「20万ページをニュースアーカイブへ公開するケース」を例に挙げて解説しています。

こちらも、Googleが公開している動画の内容を要約しつつ注目すべきポイントをご紹介しましょう。

  • Googleには20万ページを問題なくインデックスできる技術がある
  • ただし、検索結果に突然大量のページが表示された場合はマニュアルウェブスパムチームのチェック対象になる
  • チェック対象になっても、質が高ければ数十万ページの順位が落ちるのは稀
  • とはいえ、タイミングに支障がなければ段階的に公開する方が望ましい

上記の情報から、大量のページを一度に公開しても問題なくインデックスされるが、段階的に公開するよりも時間がかかると解釈できます。

インデックス状況を確認する2つの方法

インデックス状況を確認する方法を2つ紹介します。その場で簡単に調べたい場合はGoogleの特殊検索を利用し、より正確かつ詳細に調べたい場合はSearch Consoleを利用するのがおすすめです。

ただし、以前は個別ページの確認方法として有効だった「info:」コマンドは2019年3月26日付けでサポートが終了していますので注意が必要です。

Googleの検索コマンドから廃止された「info:」の機能と代用方法について

Googleの特殊検索「site:」コマンドを使う

こちらは、「個別ページ」と「Webサイト全体」の両方に対して使えるうえ、簡単に確認できる便利な方法です。Googleの特殊検索機能を利用してインデックスを調べるためには、インデックスされているか確認したいURLの前に「site:」を付けて検索します。

上記の画像は「site:https://pecopla.net/web-column/index」というURLで実際に検索した画面です。インデックスされていない場合には、上画像のように表示されます。

一方、検索したURLのWebページが正常にインデックスされている場合は、下記の画像のように表示されます。

上記画像のように該当するWebページが検索結果に表示されれば、そのWebページは正常にインデックスされていると判断できます。

また、「site:」の後にドメイン名を入力して検索することで、サイト全体のおおよそのインデックス数が確認可能です。

ただし、こちらの方法はあくまで目安の数値となり、正確な数値ではないということを認識しておいてください。

Search Consoleの新バージョンを使う

正確なインデックス状況を調べるには、2018年8月に公開された新Google Search Consoleを使用します。2019年9月に完全廃止された旧バージョンと似たような機能ですが、インデックス状況の確認に加えインデックスされない原因の特定にも役立つのが特徴です。

サイト全体のインデックス数を確認する方法

サイト全体のインデックス数を確認したい場合は、Search Consoleにログインし、左メニューバーの「インデックス」をクリックしましょう。

すると、下記画像のように「カバレッジ」と「サイトマップ」の2つのプルダウンメニューが表示されるので、赤枠で囲ってある「カバレッジ」を選択します。

Search Consoleを使ったインデックスの確認方法

下記画像の画面が表示され「有効」という欄を確認することで、サイト全体のインデックス数が分かります。

ページごとのインデックスを確認する方法

一方、個別ページを確認したい場合は左メニューバーにある「URL検査」から、または直接ページ上部の検索ボックスに調べたいURLを入力しましょう。正常にインデックスされていれば、下記のような画面が表示されます。

正常な結果

「新しくなったSearch Consoleについて詳しく知りたい!」という方は、下記の記事をご覧下さい。

2019年9月に旧サーチコンソールが完全廃止!新サーチコンソールで使えるツールを比較

インデックスされない5つの原因

インデックスを早める方法を用いてもインデックスされない場合の原因は、主に5つ考えられます。インデックスされない場合、後述の5つの原因によるものでないか確認しましょう。

ペナルティを受けている

Googleのガイドラインに違反したコンテンツを含むウェブページはペナルティーを受ける可能性がありますが、ペナルティーを受けるとインデックスされないことや、一度インデックスされたウェブページのインデックスが削除されることがあります。

ブラックハットSEOでペナルティーを受ける可能性のあるSEO対策を行なっている場合には、注意が必要です。

インデックスされない設定にしている

robot.txtやmetaタグ(noindexなど)で設定することで、クローラーのサイトもしくはウェブページへの巡回を拒否することが可能です。

初期の状態で巡回を拒否する設定になっていることは考えにくいですが、複数人でサイトを管理している場合などに、誤ってnoindexにしてしまっているということが考えられます。巡回拒否設定になっていないか確認してみるとよいでしょう。

重複コンテンツ扱いとなっている

内容の酷似したウェブページが2つのURLで存在する場合、一方のウェブページがオリジナルコンテンツとしてインデックスされ、他方のウェブページはインデックスされません。通常の場合、他のウェブページのコンテンツをコピーしなければ問題はありません。

しかし、オリジナルコンテンツがコピーコンテンツと認識され、インデックスされない(インデックスから削除)ことがあります。

クロールの頻度はPageRankに依存し、PageRankが高いコンテンツを多く含むサイトのクローラーの巡回頻度は高く、ウェブページを新規作成した際に、インデックスされるのが早い傾向があります。

そのため、PageRankの低いサイトは以下のようなことが発生する可能性があるため注意が必要です。

PageRankが低いサイトのインデックスが済んでいないウェブページのコンテンツを、PageRankが高いサイトがコピーした場合、PageRankが高いサイトの方が、コピーコンテンツであるにも関わらず、先にインデックスされる可能性があります。

そしてPageRankの高いサイトのコピーコンテンツが先にインデックスされてしまうと、PageRankの低いサイトのオリジナルコンテンツが、コピーコンテンツとみなされてしまうという逆転の現象が発生してしまいます。

これが原因でインデックスされてないという可能性がございます。

自動生成ページである

カテゴリページなどの自動生成されるページはインデックスされないことがあります。なお、カテゴリページに関してはインデックスさせることにメリットもデメリットもあるので注意が必要です。

一般的には記事数が少ないカテゴリページはnoindexにしておき、記事数が増えたらインデックスさせましょう。記事数が少ない状態でインデックスさせる場合は、カテゴリページに個別ページと同程度のユニークテキストを追加することをおすすめします。

ドメインもしくはページができたばかりである

クローラーはハイパーリンクを辿ってウェブページを巡回していますが、作成して間もないサイトの場合、他のサイトからのハイパーリンクが張られておらず、クローラーがサイトに辿り着くのに時間がかかることがあります。インデックスを早めるためには、SNSなども併用しながら、自然リンクを集めるのが重要です。

ページのインデックスを早める4つの方法

一定時間が経てば、ウェブページは自動的にインデックスされますが、次の方法を利用することで、インデックスを早めることが可能です。

URL検査(Fetch as Google)

URL検査はインデックスを行なっているGoogleクローラーに、特定のウェブページもしくはウェブページの直接リンクを巡回するように要請することができる機能です。以前は「Fetch as Google」という名称でしたが、現在では「URL検索」と名前が変更されています。

URL検査を利用することで、新規作成した記事を条件によって5分以内にインデックスさせることも可能です。しかし使用回数に制限があり、クローラーが巡回したウェブページが必ずインデックスされるわけではないので、注意しましょう。

sitemap.xml(サイトマップXML)

sitemap.xmlはサイトを構成するウェブページのURLや最終更新日などの要素をXMLタグでマークアップすることで、Googleにサイトのコンテンツの構成を伝えるファイルです。

sitemap.xmlを作成し、Search Consoleに登録しておくことで、効率的にクローラーがサイトを巡回することを可能にします。

RSSフィード

サイトのウェブページの更新情報を配信するための技術であるRSSフィードも、インデックスを促進するのに有効です。RSSフィードは最近更新されたURLのみが登録され、検索エンジンのダウンロードがsitemap.xmlよりも高頻度のため、sitemap.xmlと併せて利用しましょう。

内部リンクの整備

内部リンクを整備することで、より効率的にクローラーにサイト内のウェブページを巡回させることが可能です。クローラーはウェブページのリンクを辿りながらウェブページを巡回しています。そこで各ウェブページが内部リンクで繋がった状態にしておくことで、クローラーに内部リンクを辿らせ、一度に複数のウェブページをクローラーに巡回させることが可能です。

まとめ

パンダアップデートによりコンテンツの質が重視されるようになったため、質の低いコンテンツでインデックス数を増やしても意味を成さなくなりましたが、高品質なウェブページが多くインデックスされているサイトは検索エンジンからの評価が高いです。

日頃から内部リンクでクローラーが巡回しやすいサイトにすると同時に、sitemap.xmlやRSSフィードなどを利用して、インデックスを促進しましょう。

SEOやWEB制作に関する情報を検索

コラム

ピックアップコラム

最新コラム

人気コラム

過去の記事

ご質問やご相談などお気軽にお問い合わせください。

お電話でのお問い合わせはこちら

03-5829-9912

受付時間:平日10:00~19:00(土・日・祝日を除く)