Le terme « contenu dupliqué » fait référence aux informations trouvées dans plusieurs emplacements en ligne. Ce « un endroit » est un emplacement avec une URL . Par conséquent, vous disposez du même matériel si le contenu identique apparaît sur plusieurs adresses Web.
Même s’il ne s’agit pas strictement d’une pénalité, la duplication de contenu peut occasionnellement influencer le classement d’un site Web dans les moteurs de recherche. Lorsque de nombreux éléments sont « sensiblement similaires », comme le décrit Google, et se trouvent à plusieurs endroits sur Internet, il peut être difficile pour les moteurs de recherche de déterminer quelle version est la plus pertinente pour une requête de recherche particulière.
Contenu
BasculerComment se produisent les problèmes de contenu en double ?
Le plus souvent, les propriétaires de sites Web ne produisent pas délibérément du matériel en double pour leurs sites. Toutefois, cela ne signifie pas qu’il n’est pas présent dans le monde. Selon certaines estimations, jusqu’à 29 pour cent du matériel disponible sur le Web est dupliqué !
Jetons un coup d'œil à certaines des façons les plus courantes de créer le même matériau à l'insu de l'auteur :
Variantes d'URL
Les paramètres d'URL, tels que ceux utilisés pour le suivi des clics et le code d'analyse, peuvent parfois entraîner des problèmes de contenu en double. Non seulement cela peut être un problème causé par les paramètres eux-mêmes, mais cela peut également être un problème causé par l'ordre dans lequel ces paramètres apparaissent dans l'URL elle-même.
De même, les identifiants de session sont l’une des causes les plus courantes de duplication de matériel. Cela se produit lorsqu'un identifiant de session unique pour chaque utilisateur visitant un site Web est enregistré dans l'URL. Cet identifiant est délivré à chaque utilisateur individuellement.
Il est possible de générer du contenu en double à l'aide d'identifiants de session ou de paramètres.
Lorsque de nombreuses copies d’une page sont indexées, comme cela peut se produire lorsque des versions imprimables d’un document sont utilisées, cela peut entraîner des problèmes de duplication du contenu.
Une chose que nous devrions retenir de cela est que, lorsque cela est possible, il est généralement préférable d'éviter d'ajouter des paramètres d'URL ou des versions différentes d'URL (les informations contenues dans ces conteneurs peuvent généralement être transmises via des scripts).
Contenu qui a été supprimé ou dupliqué
Le contenu se compose non seulement d’entrées de blog et de matériel journalistique, mais il contient également des pages d’informations sur les produits. La pratique des scrapers republiant le contenu de votre blog sur leurs sites Web est peut-être la source la plus connue de contenu en double ; néanmoins, une autre source répandue de contenu identique pour les sites Web de commerce électronique est l’information sur les produits. Lorsque de nombreux sites Web différents proposent les mêmes produits et utilisent tous les descriptions de ces produits par le fabricant, le même matériel est distribué sur Internet dans plusieurs autres domaines.
Comment pouvons-nous résoudre les problèmes de contenu en double ?
La résolution des difficultés liées aux duplications de documents se résume toujours au même concept fondamental : identifier quelles copies constituent la « bonne » version de l’information.
Il est essentiel de canoniser les informations pour les moteurs de recherche si elles existent sur un site Web et sont accessibles via plusieurs URL. Discutons des trois approches les plus courantes : une redirection 301 vers la bonne URL, l'attribut rel=canonical ou l'outil de gestion des paramètres disponible dans Google Search Console.
Reportez-vous à Seahawk Media pour plus d’articles de ce type.