O termo "conteúdo duplicado" refere-se a informações encontradas em mais de um local online. Esse "local" é um endereço com um URL . Portanto, você tem o mesmo material se o conteúdo idêntico ocorrer em mais de um endereço da web.
Embora não seja estritamente uma penalidade, a duplicação de conteúdo pode, ocasionalmente, influenciar o posicionamento de um site nos mecanismos de busca. Quando muitos conteúdos são "consideravelmente semelhantes", como o Google descreve, e estão localizados em mais de um lugar na internet, pode ser difícil para os mecanismos de busca determinar qual versão é mais relevante para uma determinada pesquisa.
Como surgem os problemas com conteúdo duplicado?
Na maioria das vezes, os proprietários de sites não criam conteúdo duplicado intencionalmente. No entanto, isso não significa que ele não exista. Segundo algumas estimativas, até 29% do conteúdo na internet é duplicado!
Vejamos algumas das maneiras mais comuns pelas quais o mesmo material pode ser produzido sem o conhecimento do autor:
variantes de URL
Os parâmetros de URL, como os usados para rastreamento de cliques e código de análise, podem, às vezes, causar problemas de conteúdo duplicado. Isso pode ser causado não apenas pelos próprios parâmetros, mas também pela ordem em que eles aparecem na URL.
Da mesma forma, os IDs de sessão são uma das causas mais comuns de conteúdo duplicado. Isso ocorre quando um ID de sessão exclusivo para cada usuário que visita um site é salvo na URL. Esse ID é atribuído individualmente a cada usuário.
É possível gerar conteúdo duplicado usando IDs de sessão ou parâmetros.
Quando várias cópias de uma página são indexadas, como pode ocorrer quando são utilizadas versões de material otimizadas para impressão, isso pode levar a problemas de duplicação de conteúdo.
Uma lição importante que devemos tirar disso é que, sempre que possível, geralmente é melhor evitar adicionar parâmetros de URL ou diferentes versões de URLs (as informações nesses contêineres geralmente podem ser passadas por meio de scripts).
Conteúdo que foi extraído ou duplicado
O conteúdo não se limita a posts de blog e material jornalístico, mas também inclui páginas informativas sobre produtos. A prática de sites que copiam conteúdo de blogs em seus próprios sites é talvez a fonte mais conhecida de conteúdo duplicado; no entanto, outra fonte comum de conteúdo idêntico para sites de e-commerce são as informações sobre produtos. Quando vários sites diferentes oferecem os mesmos produtos e todos utilizam as descrições do fabricante, o mesmo material acaba sendo distribuído pela internet em diversas outras áreas.
Como podemos resolver problemas com conteúdo duplicado?
A resolução de problemas com material duplicado sempre se resume ao mesmo conceito fundamental: identificar quais cópias são a versão “correta” da informação.
É essencial canonicalizar informações para mecanismos de busca se elas existirem em um site e puderem ser acessadas por mais de uma URL. Vamos discutir as três abordagens mais comuns: um redirecionamento 301 para a URL correta, o atributo rel=canonical ou a ferramenta de gerenciamento de parâmetros disponível no Google Search Console.
Consulte a Seahawk Media para obter mais artigos como este.