重複コンテンツのチェック方法と改善方法を伝授

SEO対策実例・コラム
2017.10.30
Duplication

「キーワードやテーマをもとに記事をたくさん書いているけどなかなかGoogleでの検索順位が上がらない」そんな経験はございませんでしょうか?もちろん記事の質が低いから順位が上がらないこともあります。

今回取り上げる重複コンテンツによって順位が上がっていない可能性もあります。今回は、重複コンテンツの種類やチェック方法・改善方法をお伝えいたします。

 

重複コンテンツの種類とその影響

重複コンテンツとは、タイトルやコンテンツがサイト内外問わず他のページと重複していることを指します。 多くのWebページが存在すれば、重複コンテンツになる確率も高くなり、世の中の30%は重複コンテンツと言われています。

重複コンテンツの種類

重複コンテンツには、主に2種類あり、同じドメイン内で発生するものと、複数ドメインで発生するものがあります。また、重複コンテンツにも様々な種類があります。他重複コンテンツと見なされやすいものは以下です。

  • 1.www.○○.comや www.○○.com/index.htmlなど1つのページに複数のURLでアクセスできる(サイトリニューアルでも同様)
  • 2.タイトルだけ変えて中身が同一のページ
  • 3.PC用とスマホ用で別々のURLにしている
  • 4.画像がメインのサイト
  • 5.商品の説明がメーカーなどから提供されているものを引用している
  • 6.記事の内容が重複している

重複コンテンツによる影響

かつて、Googleに在籍していたマット・カッツ氏が重複コンテンツがあるだけで即ペナルティの対象にはならないと発言しました。しかし、あまりに多いとペナルティーの可能性もありますし、Googleでは原則的に重複コンテンツを2つ以上同時に検索結果に出さないようにしています。

特に同一サイトであれば、アクセスがばらけてしまいますので、それらが影響して検索順位の下落などが考えられますので、重複コンテンツは出来るだけ避けるようにしましょう。次に重複コンテンツのチェック方法をご紹介します。

重複コンテンツのチェック方法

自社サイト内で重複していたと自社サイト外で重複していた場合それぞれの重複コンテンツのチェック方法をご紹介します。

自社の管理サイトで重複している場合

重複コンテンツの種類でもご紹介しましたように、自社の管理サイト内で重複コンテンツがある場合、記事などの重複の他に、HTMLの構造の問題や、サイト構築時・移行時の設定ミスがあります。www.○○.comや www.○○.com/index.htmlなど1つのページに複数のURLでアクセスできる場合は、URLを直接入力すればわかりますし、記事の重複チェックは、少々原始的でありますが、1つ1つチェックしていく方法や、後程ご紹介するsujikoという重複コンテンツチェックツールで確認する方法があります。

自社管理サイト外で重複している場合

自社管理サイト以外で重複コンテンツがある場合、自社管理サイト内のHTMLの構造の問題ではなく、記事などのコンテンツが問題となる場合が殆どです。膨大なWEBサイトから重複コンテンツをチェックするのは難しいですが、チェックツールがいくつかございますので、参考にしてみてください。

重複コンテンツのチェックツールは有料のものですと、「影武者」や「コピペルナー」などがございますが、今回は無料でできるツールをご紹介します。

無料でできる重複コンテンツチェックツール3選

こぴらん

こぴらんは、フォームに文章をコピーしてチェックします。フォームに入力された文字を句点(。)や疑問符(?)など適度な分で区切り、その分が使われているページ数を 表示します。仕様は、検索窓に文章を完全一致(“”)で入力したものと同じです。

なお、最大文字数は4000文字となっており、比較的長いページでも対応できるのがメリットです。

重複コンテンツチェックツール(こぴらんのチェック画面)

 

重複コンテンツチェックツール(こぴらんのチェック結果)


こぴらん

剽窃(ひょうせつ)チェッカー

剽窃(ひょうせつ)チェッカーも、こぴらんと同様にフォームに文章をコピーしてチェックします。 フォームに入力された文字を文節単位で区切り、ウェブ上に同一の文字列がないかをチェックする仕組みで、 最大文字数は2000文字とこぴらんより少なくなっています。

しかし、中国語やロシア語に対応しているため、多言語展開をしているサイトには適しています。

重複コンテンツチェックツール(剽窃チェッカーのチェック画面)

 

重複コンテンツチェックツール(剽窃チェッカーのチェック結果)


剽窃(ひょうせつ)チェッカー

sujiko(スジコ)

こちらは、ご紹介した2サイトとは異なり、調査対象のURLを2つ入力します。 ページごとに比較しますので、わざわざ文字をコピーしなくても重複コンテンツをチェックすることができるのがメリットと言えます。

本文チェックの他にHTML類似度やcanonical属性の有無もチェック結果に表示してくれます。

なお会員登録しなくても5回まで調査することができますが、利用回数の制限をなくすためには、無料の会員登録が必要となります。

重複コンテンツチェックツール(sujikoのチェック画面)

 

重複コンテンツチェックツール(sujikoのチェック結果)


sujiko(スジコ)

重複コンテンツを見直すことによる効果と改善方法

重複コンテンツを整理し・検索エンジンに適切な情報を伝えることで、ユーザビリティーが増し、被リンクの獲得や順位上昇が期待できます。それでは、どのようにしてコンテンツを整理していけばよいか見ていきましょう。

複数のURLから1つの画面にアクセスできる場合

この場合、URLの正規化が必要となり、正規ページ以外からアクセスがあった場合301リダイレクト処理をすることで解決します。301リダイレクト処理はいくつかございますのでサイトに適した設定をしていただければと思います。

Apacheと.htaccessが利用できる場合

この場合、.htaccessに以下ように記述してください。

test.comをwwwありに統一する場合
Options +FollowSymLinks
RewriteEngine on RewriteCond %{HTTP_HOST} ^test\.com$
RewriteRule ^(.*)$ http://www.test.com/$1 [R=301,L]

Apacheのmod_Rewriteが利用できない場合

こちらは.htaccessに記述するところまでは同じですが、記述方法が異なります。

wwwあり・なしをwwwありに統一する場合
Redirect 301 / http://www.test.com/
ドメインが移転し、かつ他のページのURLが変わらない場合
Redirect 301 / http://www.test.com/
ディレクトリごと移転した場合
Redirect 301 /shop/ http://www.test.com/shopping/
個別ファイルのみ移転した場合
Redirect 301 /doc/old.html http://www.test.com/doc/new.html

phpにリダイレクト設定を記述する

phpにリダイレクト処理を記述する場合、該当するphpファイルに以下の設定を行います。

<?
Header( “HTTP/1.1 301 Moved Permanently” );
Header( “Location: http://www.test.com/new.html” );
?>

なお、使用しているサーバによって上記設定が使用できないこともございますのでご注意ください。

タイトルだけ変えて中身が同一のページが存在する場合

ポータルサイトにある市町村ページや、ECサイトで見られる色違いのページなどが該当します。 こういったページは、例え重複コンテンツでもユーザに見せる価値がありますので、 検索エンジンには、canonical属性を使って正規のページを伝える必要があります。

例えば、商品A(https://www.test.com/itemA)と商品B(https://www.test.com/itemB)があり、商品Aを正規のページとした場合は、商品Aと商品Bのヘッダータグに以下を追記します。

<head>
<link rel="canonical" href="https://www.test.com/itemA">
</head>

なお、その他canonical属性を設置する上での注意点は以下のURLをご参照いただければと思います。


rel=canonical属性に関する 5 つのよくある間違い

PCとスマホで別のページを用意している場合

PCやスマホで別のページを用意している場合は、デバイス毎に最適化されたURLがあることを、検索エンジンにも認識できるよう明示する必要があります。

PC版のページ(https://www.test.com/)とスマホ版(https://www.test.com/sp)があった場合、以下のように設定します

  • 1.PC版のページにスマホ版があることをヘッダータグ内に追記する。
<head>
<link rel="alternate" href="https://www.test.com/sp">
</head>
  • 2.スマホ版のページにPC版が正規ページあることをヘッダータグ内に追記する。
<head>
<link rel="canonical" href="https://www.test.com/">
</head>

画像がメインのサイトの場合

テキスト情報がなく、画像がメインのサイト場合、検索エンジンにって、参考となる情報が少なくなるため、 どんなサイトであるかわからなくなってしまいます。こういったサイトは検索順位も低くなりがちです。

この場合、画像にalt属性を設定して、画像がどんなものであるか検索エンジンに知らせる必要があります。

<body>
<img src="https://www.test.com/contents/img/test.png" alt="これはテスト画像です" />
</body>

上記のように、altを設定することで、検索エンジンはtest.pngはテスト画像であることを認識することができます。

商品の説明がメーカーなどから提供されているものを引用している

不動産やECサイトに限らず、商品説明などがメーカーなど提供元から引用している場合、検索エンジンは、 より信頼性のあるメーカーサイトにある商品説明のページを評価し、商品説明を引用しているサイトは、重複コンテンツとして扱われる可能性があります。 こうした場合は、骨が折れる作業ではありますが、メーカーの商品説明にはない独自の情報を入れることで、重複コンテンツと評価されにくくなっていきます。

記事の内容が重複している

自社サイト、他サイトに限らず記事を書けば書くほど重複コンテンツとなる確率が高くなってきます。

こういった場合、以下の対応方法があります。

  • 1.ページ内の記事を削除したり、似ているコンテンツを統合
  • 2.robots.txtを使用して、重複コンテンツとなっている部分のURLに対してクロールを拒否する
  • 3.noindexメタタグを設定し、インデックス非表示にする

まとめ

いかがでしたか?今回は重複コンテンツ種類から、重複コンテンツの回避方法をご紹介しました。

これは弊社の一例ですが、8月に工事系のサイトの重複コンテンツを整理(似た記事の整理・削除)、9月にある 企業の重複コンテンツを整理したところいずれも10位以内に表示されるようになりました。

この重複コンテンツを整理することによって、今まで順位が上がらなかったキーワードも上がる可能性がございますので、一度サイトの整理をしてみてはいかがでしょうか。

コラム

最新コラム

人気コラム

ご質問やご相談などお気軽にお問い合わせください。

お電話でのお問い合わせはこちら

03-5829-9912

受付時間:平日10:00~19:00(土・日・祝日を除く)