Le terme "contenu dupliqué" fait référence à des informations trouvées dans plus d'un endroit en ligne. Ce "seul endroit" est un emplacement avec une URL. Par conséquent, vous avez le même matériel si le contenu identique se trouve à plus d'une adresse web.
Même s'il ne s'agit pas à proprement parler d'une pénalité, la duplication de matériel peut parfois influencer le classement d'un site Web dans les moteurs de recherche. Lorsque de nombreux éléments sont "sensiblement similaires", comme le décrit Google, et qu'ils se trouvent à plusieurs endroits sur Internet, il peut être difficile pour les moteurs de recherche de déterminer quelle version est la plus pertinente pour une requête de recherche particulière.
Contenu
ToggleComment se pose le problème du contenu dupliqué ?
Le plus souvent, les propriétaires de sites Web ne produisent pas délibérément de matériel en double pour leurs sites. Toutefois, cela ne signifie pas qu'il n'y en a pas dans le monde. Selon certaines estimations, pas moins de 29 % du matériel présent sur le Web est dupliqué !
Examinons quelques-unes des façons les plus courantes dont le même matériel peut être fabriqué à l'insu de l'auteur :
Variantes d'URL
Les paramètres d'URL, tels que ceux utilisés pour le suivi des clics et le code analytique, peuvent parfois entraîner des problèmes de contenu dupliqué. Ce problème peut être causé non seulement par les paramètres eux-mêmes, mais aussi par l'ordre dans lequel ces paramètres apparaissent dans l'URL elle-même.
De même, les identifiants de session sont l'une des causes les plus courantes de duplication de matériel. Cela se produit lorsqu'un ID de session unique pour chaque utilisateur visitant un site web est enregistré dans l'URL. Cet ID est délivré à chaque utilisateur individuellement.
Il est possible de générer du contenu dupliqué en utilisant des identifiants de session ou des paramètres.
Lorsque de nombreuses copies d'une page sont indexées, comme cela peut se produire lorsque des versions faciles à imprimer du matériel sont utilisées, cela peut entraîner des problèmes de duplication du contenu.
Une chose à retenir est que, lorsque cela est possible, il est généralement préférable d'éviter d'ajouter des paramètres d'URL ou des versions différentes d'URL (les informations contenues dans ces conteneurs peuvent généralement être transmises par des scripts).
Contenu qui a été gratté ou dupliqué
Le contenu se compose non seulement d'articles de blog et de matériel journalistique, mais aussi de pages d'information sur les produits. La pratique des "scrapers" qui republient le contenu de votre blog sur leurs sites web est peut-être la source la plus connue de contenu dupliqué ; néanmoins, une autre source courante de contenu identique pour les sites de commerce électronique est l'information sur les produits. Lorsque de nombreux sites Web différents proposent les mêmes produits et utilisent tous les descriptions du fabricant de ces produits, le même matériel est diffusé sur Internet dans plusieurs autres domaines.
Comment résoudre les problèmes de contenu dupliqué ?
La résolution des difficultés liées aux documents en double revient toujours au même concept fondamental : identifier les copies qui sont la "bonne" version de l'information.
Il est essentiel de canoniser les informations pour les moteurs de recherche si elles existent sur un site Web et sont accessibles via plus d'une URL. Voyons les trois approches les plus courantes : une redirection 301 vers l'URL correcte, l'attribut rel=canonical ou l'outil de gestion des paramètres disponible dans Google Search Console.
Se référer à Seahawk Media pour d'autres articles de ce type.