首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >谷歌在检查重复内容方面走了多远?

谷歌在检查重复内容方面走了多远?
EN

Webmasters Stack Exchange用户
提问于 2014-11-11 03:36:00
回答 2查看 411关注 0票数 4

Google可以检测到一个与另一个URL上相同的副本完全匹配的长段落。

但我对行顺序更改的表中的内容感到好奇。虽然文本不会按顺序匹配,但内容仍然几乎是重复的。

它能归类为重复的内容吗?

例如,当我搜索Latika Joshi http://www.grotal.com/Dehradun/Dr-Latika-Joshi-C78/博士时,Google把我带到了这个页面

但下面是其他医生。现在,如果我搜索K P Joshi博士,我在一个类似的页面上登陆,K P Joshi博士在上面,Latika Joshi博士在它下面的某个地方。

对于医生来说,内容是这样的:

  • 医生-1
  • 医生-2
  • 医生-3
  • 医生-4
  • 医生-5

现在,如果我搜索博士-3,那么这个网站以这样的方式显示内容:

  • 医生-3
  • 医生-5
  • 医生-4
  • 医生-1
  • 医生-2

看起来这样的网页不会受到熊猫·阿尔戈的惩罚。

那么谷歌要花多长时间才能找到这些内容呢?

如何改进内容,使之更有价值。我想使用rel=canonical无助于这样的页面。

EN

回答 2

Webmasters Stack Exchange用户

回答已采纳

发布于 2014-11-14 13:47:56

是。这是重复的内容。这里是谷歌对重复内容的定义

重复内容通常是指在域内或域之间的实质性内容块,这些内容要么完全匹配其他内容,要么明显类似。大多数情况下,这在起源上并不具有欺骗性。

此内容与刚才以不同方式呈现的内容相同。基本上,你的内容还没有被捕捉到。

在这种情况下,您需要使用规范的URL指向要索引的“主”页。事实上,这不仅将防止潜在的处罚有重复的内容,而且可以帮助你的搜索引擎优化。谷歌在发现规范URL时所做的一件事是:

然后,我们将集群中URL的属性(例如链接受欢迎度)合并到具有代表性的URL。

这意味着指向重复内容的所有链接基本上都被认为是指向“主”页面。这显然对那一页的排名很好。

票数 3
EN

Webmasters Stack Exchange用户

发布于 2014-11-11 04:15:33

这是一个很好的问题,我不确定是否有人真的知道复制的确切界限是什么。为了阻止这种行为,这条线是故意保持模糊的。但让我试着解释一些事情,可能会帮助你理解这是如何工作的。

随着2008年谷歌学者的出现,谷歌意识到了引文的力量,以及它如何能够积极地影响它的搜索产品。在不涉及太多细节的情况下,引用Google是与创建链接的原始内容、人员、网站、作品等的任何匹配。例如,在2012年,写了一篇研究论文,并在网上提供了我作为研究人员的名字。我能够跟踪这篇文章的网站使用数据。现在,请理解,我的名字没有出现在网上,或在我的各种网站注册,我也没有参与社交媒体(本网站自2013年12月开始)。然而,我的一个网站显示,几个月来,流量的增长每天都与这篇文章非常接近。一个简单的小引用和谷歌立即知道我的主要网站的链接。这是用历史遗址登记数据完成的。

谷歌确实在寻找独特的短语、内容片段和其他数据,并在它们之间建立联系。这可以是链接文本、任何类型的内容、注册信息、姓名、地址、电话号码、电子邮件地址(甚至部分电子邮件地址)等等。这就是我们所知道的引文的症结所在。Google保存了各种引用的数据库,以帮助更好地理解站点质量、作者身份和其他方面,通过这些内容,Google可以对内容质量进行评级,并为用户返回更满意的结果。

请理解一件事。在此之前,要避免重复的内容问题,所要做的就是对内容进行足够的修改,或者设置足够的格式,这样Google就不会注意到了。一种方法是使用CSS,它将允许内容在您和我看来是相同的,但在HTML代码中的顺序与Googlebot会读取的不同。谷歌需要一个更好的机制。

它的重复内容机制的一部分是寻找与规范相比较的两个元素之间异常高数量的联系。例如,PDF文件有可能以HTML的形式发布。这不一定是一个问题,但是,比方说,两个HTML页面之间的13次引用可能表明引文高度集中,而更多的引用可能表示重复。界限是什么以及它们究竟是如何衡量的,都是保密的。

随着足够的重复内容,无论格式或秩序,谷歌会注意到它。我认为结果将取决于内容从一个页面到下一个页面的相同程度。在你自己的作品中剪切和粘贴别人作品的部分,主要是引用,这并不罕见。这是相当经常做的,特别是在SEO市场。但是,复制过多的内容可能会影响一个或两个页面。再说一次,确切的界限是谁都猜不到的。

如果你担心,问问你自己。我的内容中有多少是对另一项工作的重复,尽管重新排序,并且可能以不同的格式编排?问问自己,你是否认为足够多的复制会构成谷歌眼中太多的引文链接?然后扪心自问,我是否应该对重复的内容给予赞扬,我将如何做到这一点?我认为最后一个问题的答案取决于内容,但有一些选项可以归功于引文,而不是分散注意力。

票数 0
EN
页面原文内容由Webmasters Stack Exchange提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://webmasters.stackexchange.com/questions/71862

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档