Google新动作:处理重复内容

不管现实多么惨不忍睹,都要持之以恒地相信,这只是黎明前短暂的黑暗而已。不要惶恐眼前的难关迈不过去,不要担心此刻的付出没有回报,别再花时间等待天降好运。

这几天Google也有大动作,正在针对“重复内容”进行清理并处罚,其实,这个跟百度的飓风算法有点像,只不过“飓风算法”只是针对恶意采集内容来源的网站进行处罚。 至于谷歌这个针对“重复内容”的动作,今天我来跟大家详细的讲解下,相信百度后期也会针对这方面进行推出新的算法。 — — 及时当勉励,岁月不待人。

SEO顽疾:处理重复内容

“重复内容”在很早之前就有过讨论,针对这个以前我们都是用的canonical标签,来解决。

如果,站在搜索引擎角度,“重复内容”一直是一个非常头疼的问题之一,我相信,这个词一定已经纳入搜索引擎优化的核心区域。在搜索引擎眼中,重复内容其实可以划分三类,并不是所有的重复内容都会受到惩罚。

由于内容是SEO的核心元素,所以有很多人尝试通过采集内容来充实网站核心数据,针对这种做法,搜索引擎会毫不犹豫的去惩罚你的网站,就如“飓风算法”。

但是,如果你无意在网站中创造了重复的内容,如:由于程序原因,导致一篇内容有多个URL,这种重复内容问题,只要后期处理及时,是不会被搜索引擎处罚的。

在这里,我引用谷歌的一句话,看看谷歌是对什么样的重复内容才进行处罚的

没有任何理由,在网站上出现重复内容,除非看起来重复内容的意图是欺骗性的,并且操纵搜索引擎的结果。 - Google

通过谷歌这句话,可以从中体味到只要不是恶意的重复内容,是没有问题,但是,如果怕被惩罚,那你就得花些时间去处理这些内容。重复的内容通常是分为三类:完全重复,近似重复和跨域重复

  • 完全重复: 两个URL具有相同的内容(技术问题/完全采集)。
  • 近似重复:两个内容有小差异(伪原创)。
  • 跨域重复:多个域上存在精确或近乎重复的内容(完全采集/伪原创)。

重复的内容可能由于多种因素才产生的。在某种情况下,自身网站内容也许出现在其他网站上;网站架构或程序错误;采集或复制其他网站的内容。

这些问题都可以造成网站重复内容,这些重复内容,对我们会造成什么样的后果呢?

重复内容的后果

如果由于无意而发布了一份重复的内容,搜索引擎在大多数情况下只会将其过滤出来,并显示他们认为是SERP中最好的版本。

有时候,他们会在索引之前将其过滤掉。用户希望在搜索结果中实现多样化。所以搜索引擎会竭尽全力来实现。以下只是与重复内容相关的一些常见后果。

  • 浪费爬行:搜索机器人可以通过抓取预算来到达您的网站。如果您有很多重复的内容,它会浪费机器人的抓取预算,并且您的唯一的好页面将被更少的抓取和编入索引。
  • 浪费的链接权益:重复的页面可以获得PageRank和链接权限,但不会有帮助,因为Google不会对重复的内容进行排名。这意味着您从这些页面浪费您的链接权限,我相信百度也是。
  • SERP无法展现:没有人知道搜索算法的工作原理。因此,如果您有多个具有完全或近似重复信息的页面,则无法确定哪些页面被过滤,哪些页面有排名。这意味着您要排名的页面可能会被删除,这就是为什么有些时候,重要的页面没有排名,但不重要的页面却有,或是两个页面都无排名。

如何解决重复内容

以下几种方法可以解决您遇到的重复内容问题,希望能够给您带来实质性的帮助。

  • 使用301重定向:如果您计划从站点中删除任何重复的内容,这是一个比较不错的方法。由于某些页面可能已经被百度收录或是有外链,因此将这些页面永久重定向到正确的URL是一个不错的方法。这种做法不仅让用户浏览正确的页面,更让搜索引擎蜘蛛知道在哪里找到适当的内容。
  • 使用robot.txt阻止:这种方法只适用于独立的页面(例如:推广页面,由于参数问题,造成多个不同URL却是同一个页面)。因为如果搜索引擎无法抓取具有重复内容的网页,则无法自动检测到这些网址指向相同的内容,因此无法判断该页面是否是重复的页面。
  • 使用canonical标签:如果您打算将重复的内容保留下来,则使用canonical标签。这一步告诉搜索引擎哪个版本的内容是“真实”版本。将此标签添加到重复内容的标题中,告诉搜索机器人在哪里找到真正的内容。

虽然重复的内容是一个问题,可能会损害您的页面在SERP中的排名,但它并没有多么的可怕。除非您恶意地操纵SERP,否则搜索引擎通常不会对您造成任何惩罚。简单的说,只要不是恶意采集,一般都会没事。但是,如上所述,在您的网站上重复的内容仍然存在负面后果。我建议发现重复内容问题,应该尽力清理并解决所有问题。

原文发布于微信公众号 - SEO答疑学堂(shareseo)

原文发表时间:2017-10-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Linyb极客之路

性能优化指南:性能优化的一般性原则与方法

  作为一个程序员,性能优化是常有的事情,不管是桌面应用还是web应用,不管是前端还是后端,不管是单点应用还是分布式系统。本文从以下几个方面来思考这个问题:性能...

852
来自专栏北京马哥教育

面向容器技术资源调度关键技术对比

摘要:本文以资源分配理念:拍卖、预算、抢占出发,引出Borg、Omega、Mesos、Kubernetes架构、数据、API的特点比较。然后梳理资源共享各种不同...

3887
来自专栏PPV课数据科学社区

【数据业务】几招教你如何在R中获取数据进行分析

【IT168 编译】本文是《R编程语言》中一个系列的第二部分。在第一部分中,我们探索如何使用R语言进行数据可视化。第二部分将探讨如何在R语言中获取数据并进行分析...

3355
来自专栏北京马哥教育

专为设计师而写的GitHub快速入门教程

在互联网行业工作的想必都多多少少听说过GitHub的大名,除了是最大的开源项目托管平台,许多企业也都是用GitHub来协同开发工作,当然我们彩程也是其中之一。笔...

3796
来自专栏Java架构

干货 | 携程图片服务架构一、服务架构二、 小结

1995
来自专栏程序你好

微服务(Microservices)集成原则

在微服务的诸多优势中,最重要的动机是业务单位的规模和自主权。然而,我们仍然需要创建一个对最终用户有意义的集成体验。在为微服务之间的交互开发策略时,记住这两个目标...

1203
来自专栏架构师之旅

Mysql在大型网站的应用架构演变

写在最前: 本文主要描述在网站的不同的并发访问量级下,Mysql架构的演变 可扩展性 架构的可扩展性往往和并发是息息相关,没有并发的增长,也就没有必要做高可扩展...

1838
来自专栏Bug生活2048

告别单调工作系列——利用python「拯救」漂亮妹子

在进入正题前想聊下这位漂亮妹子「不要想多了,只是聊聊漂亮妹子的工作」,这位妹子虽然苦恼,但她做这样的事情已经一年多了,可谓毅力可嘉,有时候我就会觉得很奇怪,为什...

932
来自专栏架构师之路

分级告警策略,人性化系统监控?

要介绍统一监控平台,得先从告警策略聊起,后续再聊不同维度监控的架构与实现细节。 一、啥是告警? 监控平台发现系统异常,向系统负责人发出文字(例如,邮件/短信),...

4885
来自专栏带你撸出一手好代码

使用windows 10的8大理由

相对于在不情愿的情况下被微软强制将系统升级为windows 10和现在还在着使用windows 7的电脑同学,我是windows 10系统的积极拥护者。当win...

34611

扫码关注云+社区