「重複コンテンツ」とは、複数のオンライン上の場所に存在する情報を指します。ここで言う「1つの場所」とは、 URL。したがって、同一のコンテンツが複数のウェブアドレスに存在する場合、それは同一のコンテンツであると言えます。
厳密にはペナルティではありませんが、コンテンツの重複はウェブサイトの検索エンジンでのランキングに影響を与えることがあります。Googleの説明にあるように、多くのコンテンツが「著しく類似」しており、インターネット上の複数の場所に配置されている場合、検索エンジンが特定の検索クエリに対してどのバージョンがより関連性の高いのかを判断するのが困難になる可能性があります。.
重複コンテンツの問題はどのようにして発生するのでしょうか?
多くの場合、ウェブサイトの所有者は意図的に重複コンテンツを作成しません。しかし、だからといって、世の中に重複コンテンツが存在しないということではありません。ある推計によると、ウェブ上のコンテンツの29%が重複しているそうです。
作者の知らないうちに同じ内容が作られる最も一般的な方法をいくつか見てみましょう。
URLのバリエーション
クリックトラッキングやアナリティクスコードなどに使用されるURLパラメータは、重複コンテンツの問題を引き起こす場合があります。これはパラメータ自体に起因する問題だけでなく、URL内でのパラメータの出現順序に起因する問題である場合もあります。.
同様に、セッションIDもコンテンツの重複を引き起こす最も一般的な原因の一つです。これは、ウェブサイトを訪問するユーザーごとに固有のセッションIDがURLに保存される場合に発生します。このIDはユーザーごとに個別に発行されます。.
セッション ID またはパラメータを使用して重複コンテンツを生成する可能性があります。.
印刷に適したバージョンの資料が使用される場合など、ページのコピーが多数インデックスされると、コンテンツの重複に関する問題が発生する可能性があります。.
このことから覚えておくべきことの 1 つは、実行可能な場合は通常、URL パラメータや異なるバージョンの URL の追加を避けるのが最善だということです (これらのコンテナー内の情報は通常、スクリプトを通じて渡すことができます)。.
スクレイピングまたは複製されたコンテンツ
コンテンツはブログ記事やジャーナリズムの素材だけでなく、製品情報ページも含まれています。スクレーパーブログのコンテンツを自身のウェブサイトに転載する行為は、おそらく最もよく知られた重複コンテンツの発生源です。しかし、eコマースウェブサイトにおいて、同一コンテンツのもう一つの一般的な発生源は製品情報です。複数の異なるウェブサイトが同じ製品を販売し、いずれもメーカーによる製品説明を利用している場合、同じコンテンツがインターネット上の他の複数の場所にも配信されることになります。
重複コンテンツに関する懸念をどのように解決すればよいですか?
重複資料に関する問題の解決は、常に同じ基本的な概念に行き着きます。つまり、どのコピーが情報の「正しい」バージョンであるかを識別することです。.
ウェブサイトに情報が存在し、複数のURLからアクセスできる場合、検索エンジン向けに正規化することが不可欠です。最も一般的な3つの方法、つまり正しいURLへの301リダイレクト、rel=canonical属性、そしてGoogle Search Consoleで利用可能なパラメータ処理ツールについて説明します。.
同様の記事をもっと知りたい場合は、Seahawk Media を参照してください。