重复内容 "是指在一个以上的在线位置发现的信息。这个 "一个地方 "就是带有URL 的位置。因此,如果相同的内容出现在一个以上的网址上,你就拥有了相同的材料。
尽管严格来说这并不是一种惩罚,但重复材料偶尔也会影响网站在搜索引擎中的排名。当许多材料 "明显相似 "时(正如谷歌所描述的那样),位于互联网上不止一个地方,搜索引擎可能很难确定哪个版本与特定的搜索查询更相关。
目录
切换重复内容问题是如何产生的?
大多数情况下,网站所有者不会特意为自己的网站制作重复材料。然而,这并不意味着世界上不存在这种情况。据估计,网络上多达 29% 的资料都是重复的!
让我们来看看在作者不知情的情况下制作相同材料的几种最普遍的方式:
URL 变体
URL 参数(如用于点击跟踪和分析代码的参数)有时可能会导致重复内容问题。这不仅可能是参数本身造成的问题,也可能是这些参数在 URL 中出现的顺序造成的问题。
同样,会话 ID 也是造成材料重复的最典型原因之一。当访问网站的每个用户的唯一会话 ID 保存在 URL 中时,就会出现这种情况。这个 ID 会单独发给每个用户。
使用会话 ID 或参数生成重复内容是可能的。
当一个页面的许多副本被编入索引时(如使用便于打印的材料版本),可能会出现内容重复的问题。
我们应该从中明白的一点是,在可行的情况下,通常最好避免添加 URL 参数或不同版本的 URL(这些容器中的信息通常可以通过脚本传递)。
被搜刮或复制的内容
内容不仅包括博客文章和新闻资料,还包括有关产品的信息页面。搜刮者在他们的网站上重新发布你的博客材料的做法可能是最著名的重复内容来源;然而,电子商务网站的另一个普遍的相同内容来源是产品信息。当许多不同的网站提供相同的产品并都使用制造商对这些产品的描述时,相同的资料就会在互联网的其他几个地方传播。
如何解决重复内容问题?
解决重复资料的难题总是归结于同一个基本概念:确定哪些副本是信息的 "正确 "版本。
如果信息存在于网站上,并且可以通过一个以上的 URL 访问,则必须为搜索引擎规范化信息。下面让我们讨论三种最常见的方法:301 重定向到正确的 URL、rel=canonical 属性或 Google Search Console 中的参数处理工具。
如需了解更多此类文章,请参阅Seahawk Media 。