El término "contenido duplicado" se refiere a la información que se encuentra en más de una ubicación en línea. Ese "lugar único" es una ubicación con una URL . Por lo tanto, se tiene el mismo material si el mismo contenido aparece en más de una dirección web.
Aunque no se trata estrictamente de una penalización, la duplicación de material puede influir ocasionalmente en la clasificación de un sitio web en los motores de búsqueda. Cuando muchos fragmentos de material son "apreciablemente similares", como lo describe Google, y se encuentran en más de un lugar de internet, puede resultar difícil para los motores de búsqueda determinar qué versión es más relevante para una consulta de búsqueda específica.
¿Cómo surgen los problemas de contenido duplicado?
La mayoría de las veces, los propietarios de sitios web no producen material duplicado a propósito. Sin embargo, esto no significa que no exista en todo el mundo. Según algunas estimaciones, ¡hasta un 29 % del contenido en la web está duplicado!
Echemos un vistazo a algunas de las formas más comunes en que se puede crear el mismo material sin el conocimiento del autor:
Variantes de URL
Los parámetros de URL, como los utilizados para el seguimiento de clics y el código de análisis, a veces pueden generar problemas de contenido duplicado. Esto puede deberse no solo a los propios parámetros, sino también al orden en que aparecen en la URL.
De igual forma, los ID de sesión son una de las causas más comunes de duplicación de contenido. Esto ocurre cuando se guarda en la URL un ID de sesión único para cada usuario que visita un sitio web. Este ID se asigna a cada usuario individualmente.
Es posible generar contenido duplicado utilizando identificadores de sesión o parámetros.
Cuando se indexan numerosas copias de una página, como puede ocurrir cuando se utilizan versiones de material aptas para impresión, esto puede generar problemas de duplicación de contenido.
Una cosa que debemos sacar de esto es que, cuando sea posible hacerlo, generalmente es mejor evitar agregar parámetros de URL o diferentes versiones de URL (la información en esos contenedores generalmente se puede pasar a través de scripts).
Contenido que ha sido raspado o duplicado
El contenido no solo consiste en entradas de blog y material periodístico, sino que también incluye páginas de información sobre productos. La práctica de los scrapers de republicar el contenido de tu blog en sus sitios web es quizás la fuente más conocida de contenido duplicado; sin embargo, otra fuente frecuente de contenido idéntico para sitios web de comercio electrónico es la información de productos. Cuando muchos sitios web diferentes ofrecen los mismos productos y todos utilizan las descripciones del fabricante, el mismo material se distribuye por internet en varias otras áreas.
¿Cómo resolvemos los problemas con contenido duplicado?
La resolución de las dificultades con material duplicado siempre se reduce al mismo concepto fundamental: identificar qué copias son la versión “correcta” de la información.
Es fundamental canonizar la información para los motores de búsqueda si existe en un sitio web y se puede acceder a ella mediante más de una URL. Analicemos los tres enfoques más comunes: una redirección 301 a la URL correcta, el atributo rel=canonical o la herramienta de gestión de parámetros disponible en Google Search Console.
Consulte Seahawk Media para obtener más artículos como este.