【Google推奨】重複コンテンツのパターン別対処法!ペナルティを受けるコピペの割合とは?
2023.07.10
「記事のスペックは競合サイトに劣っていないのに、なかなか検索順位が上がらない」そんな経験があるのなら、重複コンテンツが原因かもしれません。
もちろん、検索順位が上がらないのは複数の要素が複合的に影響していますが、今回取り上げる重複コンテンツもSEOに不利な要因です。
そこで本記事では、重複コンテンツの種類・SEOへの影響・チェック方法、Googleが推奨しているパターン別の対処法について解説します。
Google基準の重複コンテンツとは?
重複コンテンツとは、タイトル・文章・画像といった「構成要素」および「内容」が、他ページと酷似しているページを指しており、扱いは「コピーコンテンツ」と同じです。
Googleの公式サイトでは、重複コンテンツの定義について以下のように解説されています。
単一のページに複数の URL でアクセスできる場合や、異なるページのコンテンツが類似している場合(たとえば、あるページにモバイル版と PC 版両方のURLがある場合)、Google はそのようなページを同じページの重複版と見なします。
引用元:Google検索セントラル
つまり、サイト内部・外部を問わず複数の異なるURLから「全く同じ」または「コンテンツの一部」が似ているページにアクセスできる状態であれば、製作者の意図にかかわらず重複コンテンツだとみなされてしまうのです。
サイト内のページ数が多いほど発生する確率が高くなり、ネット上の30%は重複コンテンツだと言われています。
重複コンテンツの種類
重複コンテンツを大きく分類すると、同一ドメインの「サイト内部」で発生するタイプと、別ドメインである「外部サイトとの間」で発生するタイプの2種類に分けられます。
ここからは、サイト内部と外部それぞれについて重複コンテンツが発生しやすい具体例を見ていきましょう。
自サイト内部の重複コンテンツ
下記の一覧は、すべてサイト内部の重複コンテンツと見なされる可能性があります。
▼サイト内部で発生しやすい重複コンテンツ
- URLに一貫性が保たれてない
- ECサイトでブランド元から提供された画像をメインにしている
- 商品説明でメーカーから提供された定型文を使っている
- 全国向けポータルサイトなど、類似ページを地域別に発信している
- 関連性の高いKWごとにページを作成した結果、内容が似てしまう
- 他サイトのコンテンツを参考にした結果、内容が似てしまう
特にありがちなのが、URLの表記に一貫性が保たれていないケースです。
下記のように、微妙に異なるURLから全く同じコンテンツへとアクセスできる場合、たとえWeb制作者が存在に気づいていなくても重複コンテンツとして扱われる可能性があります。
▼一貫性のないURL
- https・httpが統一されていない
- URLのwww有り・無しが混在している
- URL末尾のindex有り・無しが混在している
- PC用とモバイル用のURLが混在している
- 旧ドメインと新ドメインが混在している
外部サイトによる重複コンテンツ
他サイト内に自社ページの重複コンテンツが作られる主な原因として、下記の2つが挙げられます。
▼他サイトにコンテンツを提供している
コンテンツを提供して大手メディアで配信してもらう、有識者サイトで被リンクとして紹介される場合、自社が重複コンテンツの不利益を被るリスクはありません。
ただし、自社がAサイトに提供したコンテンツが「別のBサイト」にて無断で3次利用されている場合、Bサイトは重複コンテンツを保有していると判断される可能性があります。
▼他サイトにコンテンツを盗用されている
他サイトにコンテンツを盗用された場合、通常であれば自サイトがオリジナルコンテンツと判断されるため、悪影響はありません。
ただし、ドメインパワーが自サイトよりも盗用した他サイトの方が強い、引用・出展など適切に処理されていない場合は、ごく稀に本来オリジナルである自サイトの方が重複コンテンツだと誤認されるケースもあります。
コピペがコピーコンテンツと判断される割合は?
結論から言うと、Googleはコピーコンテンツと判断する文章のコピペ率を明示していません。
ただし、ほとんどのコピペチェックツールは下記の割合で区別しています。
▼コピペ率の目安
- 30%未満:重複コンテンツには当たらない
- 30~60%:重複コンテンツと判断される可能性が高い
- 60%以上:重複コンテンツと判断される
なぜ重複コンテンツはSEOに悪影響なの?
そもそも、なぜ重複コンテンツはSEOにとって不利なのでしょうか?
ここからは、重複コンテンツがSEOに与える代表的な4つのリスクについて解説していきます。
▼重複コンテンツがSEOに不利な理由
- 検索結果に表示され難くなる
- ユーザー体験が損なわれる
- クローラビリティが低下する
- 被リンクのSEO評価が分散する
検索結果に表示され難くなる
Googleの検索エンジンは、基本的にオリジナルコンテンツ(正規URL)と重複コンテンツが同時に検索結果に表示されないようにプログラムされています。
もちろん、ランキング付けで最も優遇されるのはオリジナルコンテンツです。
一方、重複コンテンツは上位表示されないのはもちろん、検索結果から除外される可能性もあります。
どんなに有益な情報が書かれていようと、重複コンテンツというだけでオリジナルよりも劣るページ、つまりSEO評価が低く検索結果に表示する価値がないと判定されかねないのです。
ユーザー体験が損なわれる
1つ目のWebページにアクセスして疑問や悩みが解決できなかったユーザーは、2つ目のWebページにアクセスして答えを探します。
にもかかわらず、検索結果の画面に似たような内容の重複コンテンツばかりが並んでいたら、ユーザーはいつまでたっても探している情報を見つけることができません。
だからこそ、Googleはユーザーにさまざまな情報が届くよう、重複コンテンツを除外して、オリジナル性の高いコンテンツだけを上位化しているのです。
クローラビリティが低下する
Googleが公式サイトで明記している通り、重複コンテンツがクロールされる機会は、オリジナルコンテンツに比べて非常に少ないのが実情です。
正規ページは最も高い頻度で定期的にクロールされます。重複ページについては、Google がサイトをクロールする負荷を軽減するため、正規ページより低い頻度でクロールされます。
引用元:Google検索セントラル
被リンクのSEO評価が分散する
被リンクのSEO評価が分散するのも、重複コンテンツがSEOに不利に働く要因です。
例えば、本来であれば被リンクのSEO評価が100もらえるはずが、重複コンテンツを含めて類似ページがサイト内に2つ存在すると、SEO評価が50:50に分散されてしまいます。
なお、被リンクを増やすコツについては下記の記事を参照してください。
関連記事
ペナルティ対象の重複コンテンツとは?
Googleの公式サイトによると、「自サイトと他サイトの間で発生する重複コンテンツ」に限り、ペナルティ対象となります。
一方、自サイトの中だけで発生した重複コンテンツはペナルティの対象外です。
「重複コンテンツのペナルティ」などというものは存在しません。少なくとも、ほとんどの人がそう言うときの意味はそうではありません。
別のサイトと同じコンテンツを持つという考えに関連するペナルティがいくつかあります。たとえば、他のサイトからコンテンツをスクレイピングして再公開する場合や、追加の価値を追加せずにコンテンツを再公開する場合などです。
引用:Google検索セントラル
重複コンテンツの有無を調べる方法
「自サイト内で重複コンテンツが発生していないか」「他サイトに盗用されていないか」と心配している方に、代表的なチェック方法を4つご紹介します。
▼重複コンテンツの調査方法
- Google検索のコマンドでチェック!
- Googleサーチコンソールでチェック!
- 類似ページ判定ツールでチェック!
- コピペ判定ツールでチェック!
Google検索のコマンドでチェック!
こちらの方法は、公開されているWebページであればサイト内外を問わず重複コンテンツの存在をチェックできるのが魅力です。
そもそも、Google検索には類似ページが同時に表示されないようにフィルタ機能が備わっています。
言い換えれば、このフィルタ機能を解除することで重複コンテンツの有無が検索結果で確認できるようになるのです。
▼Googleのフィルタ機能を解除する手順
- Googleの検索窓口に調べたいURLを入力し
- 入力したURLの末尾に「&filter=0」を追加して検索する
- 除外されていたコンテンツを含めた検索結果が表示される
Googleサーチコンソールでチェック!
Google Search Consoleなら、「自サイト内の重複コンテンツ」と「他サイトとの類似によりペナルティを受けているページ」の有無を両方とも確認することができます。
なお、Googlesサーチコンソールは2022年6月付けで「UIの一部」および「問題の分類方法」が変更になって以降、調査範囲によって下記のように使い分けられるようになりました。
- ページ単位で重複コンテンツの有無を調査:URL検査ツール
- サイト全体で重複コンテンツの有無を調査:インデックスのページレポート(旧:インデックスカバレッジレポート)
- 他サイトとの類似によるペナルティの有無を調査:手動による対策
そもそも、「Search Consoleって何?」という方は、下記の記事を参考にしてください。
関連記事
自サイト全体で重複コンテンツの有無を調査する手順
サイト全体に対して重複コンテンツが存在するかどうかを調べる場合は、下記の手順で行います。
▼調査手順
- サーチコンソールにログイン
- 左メニューの「インデックス作成」をクリック
- 「ページ」をクリック
- 調査結果(ページがインデックスに登録されなかった理由)が表示される
サイト内で重複コンテンツが見つかった場合は、調査結果に「重複しています。Googleにより、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」という項目が表示されます。
他サイトとの類似によるペナルティの有無を調査する手順
一方、自サイトに他サイトとの類似によってペナルティを受けているページがあるかどうかを調べたい時は、下記の手順で行います。
▼調査手順
- サーチコンソールにログイン
- 左メニューの「セキュリティと手動による対策」をクリック
- 「手動による対策」をクリック
ペナルティを受けているページがなければ、「問題は検出されませんでした」と表示されます。
一方、ペナルティを受けているページが存在しているなら、Googleサーチコンソールの指示に従って対策を講じてください。
類似ページ判定ツールでチェック!
出展:sujiko.jp
sujiko.jp(スジコ)は、特定のコンテンツ同士を検証するチェックツールです。
調査対象のURLを2つ入力するだけで比較できるので、わざわざ本文のテキストをコピペする必要はありません。
本文チェックの他に、「HTML類似度」や「canonical属性」の有無も判定結果に表示してくれます。
なお、非会員でも5回までなら調査することができますが、利用回数の制限を解除するには無料の会員登録が必要です。
コピペ判定ツールでチェック!
出展:こぴらん
「こぴらん」は、入力フォームに文章をコピペして検証する完全無料のチェックツールです。
フォームに入力されたテキストを句点(。)や疑問符(?)など適度な位置で区切ると、その分が使われているページ数が表示されます。
文章が完全に一致しているかどうかを確認したい時は、Google検索と同じく文頭に「“」を、文末に「 ”」を付加しましょう。
なお、最大文字数は4,000文字となっており、比較的長いページでも対応できるのがメリットです。
重複コンテンツに対するGoogleの見解
ここからは、Googleが重複コンテンツの解決策として「推奨している対処法」と、「推奨していない対処法」に分けて解説していきます。
Google推奨の対処法
Googleが推奨している重複コンテンツの対処法は、下記の通りです。
▼Googleが推奨している重複コンテンツの対処法
- そもそも、重複コンテンツを作らない
- やむ終えない事情で発生した場合は、URLを正規化する
さらに、重複ページを解消するためにURLの正規化を行う場合は、下記の方法が推奨されています。
▼Googleが推奨しているURL正規化の方法
- rel=canonical <link> タグ
- rel=canonical HTTP ヘッダー
- サイトマップ
- 301リダイレクト
- ページの AMP バージョン
Google非推奨の対処法
一方、「robots.txt」と「URL 削除ツール」は、Googleから重複コンテンツの対処法として推奨されていません。
・正規化の目的で robots.txt ファイルを使用しないでください。
・正規化の目的で URL 削除ツールを使用しないでください。URL 削除ツールでは、URL のすべてのバージョンが検索で非表示になります。
引用:Google検索セントラル
重複コンテンツの対処法をパターン別に解説!
上記を踏まえたうえで、ここからは下記6パターンの重複コンテンツについて、それぞれの対処法を解説していきます。
▼重複コンテンツのパターン
- URLが正規化されていない
- 動的ページでURLが自動生成されている
- 一覧ページと詳細ページの内容が重複している
- 定型文を使いまわしている
- 自サイトで他サイトのコンテンツをコピペしている
- 他サイトに盗用されている
URLが正規化されていない
一口に「URLが正規化されていない状態」と言っても、ケースによって対処法は違います。
ここからは、代表的な3つのケースに分けて対処法を解説していきます
対処法①:301リダイレクト
「www」や「index」の有り無しなどでURLが統一されていないが、ユーザーからのアクセスを1つのURLだけに集約したい場合は、Googleが推奨している301リダイレクトで対処しましょう。
301リダイレクトは、似たようなURLの内1つを正規URLに指定し、他の重複コンテンツを正規URLへ転送するために用います。
転送処理を設定したページは検索結果に表示されなくなるため、重複コンテンツの存在を無効化できるのが特徴です。
301リダイレクトの設定方法は5種類ありますので、下記の記事を参照して下さい。
関連記事
対処法②:canonicalタグの設置
下記に当てはまる場合は、canonicalタグでの対処がおすすめです。
▼canonicalを使用すべきケース
- 301リダイレクトが使えない
- ユーザーが類似ページ毎にアクセスできるよう、すべてのURLを残したまま運用したい
正規URLを強制指定する301リダイレクトとは違い、canonicalの効果はクローラーに「どのURLが正規なのかヒントを与えて誘導する」程度のレベルです。
例えば、カラーバリエーションごとに分けているページへのアクセスを確保したままURLの正規化を実行したい場合は、htmlの<head>内に正規URLを記述してcanonicalタグを設置しましょう。
▼canonicalの記述例
<head>
<link rel="canonical" href="正規化したいURL">
</head>
関連記事
対処法③:alternateタグ
PCとスマホで別々のページを用意している場合は、デバイス毎に最適化されたURLがあることを、検索エンジンに知らせる必要があります。
PC版(https://www.test.com/)とスマホ版(https://www.test.com/sp)があった場合、以下のように設定します。
▼ステップ1:PC版のページにスマホ版があることをヘッダータグ内に追記する
<head>
<link rel="alternate" href="https://www.test.com/sp">
</head>
▼ステップ2:スマホ版のページにPC版が正規ページあることをヘッダータグ内に追記する
<head>
<link rel="canonical" href="https://www.test.com/">
</head>
ただし、本来Googleはデバイス毎に異なるURLを設定する手法を推奨していません。
Googleが推奨している最良の方法は、レスポンシブデザインによるURLの統一です。
関連記事
動的ページでURLが自動生成されている
商品の色違いページなど、ユーザーに適したHTMLファイルが自動生成される「動的ページ」も、重複コンテンツの一種です。
パラメータ部分だけが異なる類似URL、と言った方がイメージしやすいかもしれません。
対処法①:canonicalタグの設置
「動的ページ」がサイト内に存在している場合は、すべてのURLを残したままURLの正規化ができる「canonicalタグ」で対処しましょう。
Canonicalタグの設定方法については、前述した解説文を参考にしてください。
対処法②:URLパラメータツールは2022年4月でサポート終了
以前は、動的ページの対処法として「Search ConsoleのURLパラメータツール」が多用されていました。
しかし、GoogleはURLパラメータツールのサポートを2022年4月26日づけで終了しており、現在では使用できません。
一覧ページと詳細ページの内容が重複している
関連性の高いコンテンツが増えてくると、一覧にした「まとめページ」を作ることもあるでしょう。
ただし、一覧ページで詳細ページを紹介する際に下記のような手法を用いていると、重複コンテンツと判断される可能性があります。
▼NG例
- 詳細ページのリード文を、そのまま解説として利用している
- 詳細ページの一部を抜粋し、そのまま解説として利用している
対処法①:解説を新たなオリジナル文にする
一覧ページに載せる詳細ページの解説文は、下記のいずれかを選択して対処しましょう。
▼対処法
- 新に執筆したオリジナルの解説文を載せる
- 書き換えや追記によって、概要のオリジナル性を高める
定型文を使いまわしている
定型文を複数の記事で繰り返し使っている場合も、重複コンテンツと見なされる可能性があります。
▼定型文の一例
- 単語や用語解説
- サイト運営会社の紹介文
- 執筆したライターのプロフィール
対処法①:類似性を低下させる
定型文であっても、ある程度のオリジナル性は必要です。
言い回しの表現を変える、あるいは加筆などによって類似度を低下させましょう。
また、別途用意した専用ページへリンクを設定しておくのも有効な手段です。
自サイトで他サイトのコンテンツをコピペしている
他サイトの記事を盗用したコピーコンテンツは、悪意の有無を問わずGoogleのペナルティ対象です。
テキスト部分だけでなく、画像や見出し構成もすべてオリジナル性が求められます。
対処法①:オリジナル記事を作成するコツを知る
結論から言うと、手間を惜しまず参考にした他サイトの内容を咀嚼してから、自分なりの表現に書き変えたオリジナルコンテンツを作り直すしかありません。
コピペ率を30%未満に抑えるには、下記のような手法が効果的です。
▼オリジナル性を向上させる手法
- 結論→解説の順番で執筆するなど、本文ライティングで独自性を演出する
- 一目で探している情報が伝わるよう、文章ではなく「箇条書き」を使う
- 独自の「例え話」を盛り込む
- 本文を「質問」と「答え」のみのチャット形式にする
- 手作りの解説用イラストを掲載する
- 上位サイトに不足している情報を追加する
- 外注する際はマニュアルを用意し、構成案の段階で内容をチェックする
他サイトの文章が、手を加える余地がないほどベストだと思える時は、正攻法の「引用」を設定しましょう。
他サイトに盗用されている
コンテンツの無断盗用は、明らかな著作権違反です。
場合によっては、盗作である他サイトの記事がオリジナルだと誤認され、自サイトの方が重複コンテンツだと見なされて被害を受け兼ねません。
盗用された場合は、自サイトへの流入が不当に奪われないよう、後述する対処法を活用しましょう。
対処法①:削除申し立て
盗用によりコピーコンテンツを作成されてしまった場合は、下記の手段で「削除申し立て」を行います。
▼削除申し立ての手順
- 該当の他サイトにコピーコンテンツの根拠を伝えたうえで、削除を依頼する
- Googleサーチコンソールの「削除リクエストフォーム」から著作権侵害を申告する
著作権侵害をGoogleに申告する手順は、下記の記事で詳しく解説しております。
関連記事
まとめ
これは弊社の一例ですが、8月に工事系サイトの重複コンテンツを整理(似た記事の洗い出し・削除)し、続いて9月にも某企業のサイトで同様の対処法を試したところ、いずれも10位以内に表示されるようになりました。
結果として、今まで検索順位が上がらなかったキーワードも「重複コンテンツの整理」によって検索上位にランキングされる可能性があると実証できたのです。
一度、自サイトに重複コンテンツが含まれていないか整理してみてはいかがでしょうか。
関連