在绝大多数情况下,网站所有者不会故意创建重複的内容,但这并不表示不会发生。实际上据估计,高达29%的网页内容实际上是重複的内容!

让我们来看看一些最常见的重複内容是无意中创建的:

1. 网址变体

网址参数(如点击跟踪和某些分析代码)可能会导致重複内容问题,这个问题不仅可能由参数本身产生,还包括这些参数在URL中出现的顺序。

程式码範例

www.newscan.com.tw/blue-widgets?color=blue 
www.newscan.com.tw/blue-widgets
www.newscan.com.tw/blue-widgets?color=blue&cat=3 
www.newscan.com.tw/blue-widgets?cat=3&color=blue

同样,session ID是常见的重複内容发生原因,当每一个用户网址参数中有不同session ID时,就会发生这种情况。

当多个版本的网页被索引时,友善列印的内容也会导致重複内容问题。

程式码範例

www.newscan.com.tw/blue-widgets 
www.newscan.com.tw/print/blue-widgets

避免此问题的较好方式是,避免添加URL参数或URL的替代版本(其中包含的信息通常可以通过scripts传递)。

HTTP与HTTPS或WWW与非WWW页面

如果您的网站在「www.site.com」和「site.com」上有不同的版本,并且这两个版本都有相同的内容,您应该已经创建了每个版本的重複网页。这同样适用于http://和https://维护版本的网站。如果网页的两个版本都存在并且可以被搜索引擎检索,则会遇到重複内容问题。

撷取或是拷贝内容

内容不仅包括部落格文章或编辑内容,还包括产品讯息网页。若在自己的网站上重新发布部落格内容,这可能是常见的重複内容来源。电子商务网站也存在类似问题:如果许多网站出售相同商品并使用製造商的描述,则相同的内容会出现在多个位置。

如何解决重複的内容问题

解决重複内容的主要目标是指定哪个内容是【最正确的】。

只要网站上的内容可以在多个网址上找到,应对搜索引擎进行规範化处理,以下是三种主要方法:

301转址

程式码

Google Search Console 中的主网域和参数处理

Google Search Console可让您设定网站的主要网域并指定Googlebot如何处理不同的URL参数,这可能有助于解决重複内容问题。

儘管这些变更适用于Google,但不会影响其他搜索引擎,您需要针对其他搜索引擎进行相应调整。

处理重複内容的其他方法