如何理解谷歌眼中的低质量页面?

译者:Nic 审校:朱玉雪

本文长度为3529字,预估阅读时间6分钟

我们今天要向大家介绍的是谷歌是通过哪些因素来判定登录页面质量的高低

衡量页面质量的高低时,Google会考虑哪些因素,我们自己能否识别?这里提供了一个清单列表,有助于分析哪些页面达标,另一些可能还不够好;考虑因素包括从搜索行为、页面加载时间到拼写错误等等。这期的’白板星期五’,Rand来为大家逐一剖析。

  • 视频文本

大家好,各位粉丝,欢迎来到新一期的’白板星期五’。本周,我们将讨论Google是如何判定网站中网页质量的高低,以及对低质量页面有哪些优化方案。

在上期的’白板星期五’中讨论过,相信很多人也关注Moz的Britney Muller关于删除低质量页面的实践,看到了来自SimilarWeb的Roy Hinkis谈他们如何从网站上删除低质量页面(https://www.similarweb.com/blog/improve-seo-ranking),以提高网站整体排名。这一策略的挑战在于如何判定哪些是真正低质量的页面,其构成的因素包括哪些?

1

Google眼里的质量是什么?

Google对于页面质量高低的判断自有一套标准,其中一些一目了然,大家也相对熟悉;相对而言,另外一些可能就不那么容易琢磨得透。一般来说:

  • Google希望网页提供的内容是独特的,或者说是唯一的。
  • 他们希望网页提供给搜索者的内容具有唯一的价值,不仅仅是文字表达上,更希望其内容带来与众不同的价值。如果你对这点有疑惑,可以参考白板上的’独特价值’(https://moz.com/blog/how-to-provide-unique-value-in-your-content-whiteboard-friday)那部分。
  • Google 还很看重那些有很多外部来源链接的页面。页面被引用的次数越多,该页面就有更高机会被认作质量高。
  • Google判断高质量页面,涉及的因素不仅仅包括链接到这个页面的来源、域名还包括链接到这个页面的其他高质量页面,既可以是内部链接也可以是外部链接。因此,你可以把网站中高质量的网页链接到本站的其他网页上,Google是认同这一做法的。
  • 网页成功为搜索者提供了所需要的答案。

打个比方,在Google上搜索关于“压力洗涤”的问题。我首先输入了“pressure washing”,这时紧接着出现了搜索结果页面。点击搜索结果页面上的某个相关网页链接后,我可能会继续停留在该搜索结果页面上,也可能返回Google搜索另外一个完全不相关的问题,还可能干脆跑去做其他的事情,比如访问其他网站、回复电子邮件等。无论以上哪种情况,Google都会视为:很好,用户已经在那个搜索结果页面上找到了他们想要的答案。

反之,当点击搜索结果链接后,得到的结果页面是低质量的(译者注:即不相关或不能回答用户的问题);这时又回到搜索结果页,选择其他的结果链接,这相当于告诉Google第一个结果页面没能成功回答搜索者的查询请求。这种情况发生时,Google会将这项活动称为pogo-stickin:因为第一个结果上没有你要的答案,所以你要去访问另一个结果页。这可能导致页面被降级,因为它被Google判定为质量较低。

  • 无论在何种方式的连接情况下,都能保证页面的快速加载。
  • 无论是在移动设备、桌面设备、平板电脑还是笔记本电脑等各式设备上,Google视为的高质量页面都有着友好直观的用户体验和用户设计。
  • Google希望看到语法正确和拼写准确的内容。可能大家会觉得惊讶。但我们通过一些测试发现,由于拼写差或语法差,谷歌会从搜索结果显示中移除特色摘要。假设原本有一个特色摘要,在SERP表现也很好;但我们有意做些不合常规的改动后,谷歌会认为:“等等,这不再符合条件,这不再是高质量的答案。“ 这告诉我们,Google确实会对此类页面信息进行跟踪分析。
  • 非文本内容需要有替代文本。这就是为什么Google鼓励使用alt属性,他们喜欢视频配有文字稿。正如在’白板星期五’的视频下面都有文字稿,提供了在无须打开视频的情况下通过阅读的方式获取所有内容。这可能只是因为你不乐意听视频,又或者是出于语言技能或者残疾障碍的限制。
  • 他们也喜欢看到语言组织良好,易于消化和理解的内容。Google利用了一些方法来进行解析,例如他们的机器学习系统。
  • 另外,谷歌希望看到指向其他来源的内容,这有助于获取更多信息、跟踪任务以及来源引用。通常页面的外部链接就可以实现这一点。

这列表不能包罗万象,但这些都是Google判断页面质量高低的一些基本原则。

2

SEOs 和营销者如何过滤网页来识别高质量或低质量页面?

作为营销人员或SEO,我们可以这样考虑:虽然我们无法涉及到Google衡量的每一个细节,但可以先关注那些有助于确定高质量的因素;对于那些质量较低的,我们可以考虑重新修改以提高质量,或者直接删除掉。

一般来说,不建议使用以下指标:

A. 网站停留时间

B. 跳出率

C. 自然访问

D. 辅助转换

为什么呢,因为这些指标参数可能存在误导性。

例如有人在你的网站上花了很长一段时间,最理想的情况自然是他们真正被网站内容所吸引。但不能排除,还可能是因为花了很长时间也没找到需要的东西,这就令人沮丧了;他们会返回搜索结果页面,访问其他结果链接去寻找答案。有很多原因会造成搜索者对页面的不满意,例如很多弹出窗口,要逐个点击来关掉它们,光是找到’关闭’按钮就老费劲了;更别提还得一直向下滚动页面来进行查看。如此等等都会导致对提供的结果页不满意。

跳出率也类似。当搜索结果一目了然的解答了问题;又或者下一步动作是跳去另外的页面;又或甚至无须任何后续动作,这些都会导致跳出率升高。打个比方,“嘿,我需要一些关于已处理过木材的高压清洗技巧。我要知道,如果在某个压力值下对木材进行高压洗涤,是否可以有效去除之前的处理。”结果是,不能。好,谢谢!我已经找到答案,没必要再继续访问你的网站了。这时跳出率就会很高,也许80%或90%的跳出率。但您已经回答了搜索者的查询,这就完全符合Google的想法。所以跳出率本身在这种情况下不是很合适的指标。

接着来说说自然访问。假如有一个质量相对较低的页面,因某些原因获得较多的自然访问流量:原因之一可能是页面确实中存在某些有价值的内容,又或者是页面中堆砌了一大堆长尾的东西;但搜索者来访问后对页面内容很失望。尝试从更长期的时间范围来观察(几个星期或几个月的时间内,而不仅仅是几天),以获得更准确的认识。当然仅就这个页面本身而言,算不上一个高质量的页面。

辅助转化是一个很好的例子。此页面可能不带来任何直接转化:可以用来放置cookie,也可能是再次营销或重新定位,还可以是让来访者注册电子邮件列表。即使没有达成任何直接的目标转化,也并不意味着它是低质量的内容。

3

应该怎么做才更好呢?

建议通过综合多个指标来进行分析,不局限于单个指标。

1.以下为若干用户参与度相关指标的一个组合,它包括:

  • 总访问数
  • 外部访问数和内部访问数
  • 查看用户登陆后访问的页面数。来访者在登陆页面后,继续浏览网站上的其他页面,这个反馈比较令人满意。如果后续浏览量很低,可能存在一些问题。但别匆忙下结论,尝试把网站停留时间、跳出率以及总访问量和外部访问量这些指标放在一起来综合分析。

2. 对站外指标组合分析,例如:

  • 外部链接
  • 根域链接的数量
  • PA和您的社交分享如Facebook,Twitter,LinkedIn分享,这些都适用。对那些被分享到社交媒体上的内容,即便可能不完全符合搜索者的需求,但仍然表明它们是高质量的内容。

3.搜索引擎指标,这包括:

  • 索引建立 - 通过直接在搜索栏或浏览器栏中输入URL来查看页面是否已被建立到索引中。
  • 您还可以分析那些关系到自身标题排名的因素。
  • 您可以在Google Search控制台上查看点击率。
  • 您可以对比唯一性内容和重复内容产生的差异。如果在输入一个URL后,网站返回多个页面;或者对页面标题进行搜索,结果出现多个网址,这都告诉我们,网站可能存在内容重复的问题。

4.人工审查:

  • 检查一下,是否有来自子栏目、子文件夹或子域名的页面。如果有,问问自己:“哦,这是否真的有助于搜索者?内容是否是最新的,是否符合我们组织的标准?“

4

制作三个桶

通过指标的不同组合,我们可以对网页分类整理(分别放到这三个桶里)。有几个工具可以轻松帮助导出所有URL,例如尖叫青蛙(Screaming Frog)或 Moz 的抓取工具或 DeepCrawl。将所有页面导出到电子表格中,再运用这些组合指标进行排序和过滤。您可以创建某种算法或者指标的组合以更好作出分析。对筛选后的结果最好人工复查。我的建议是分为以下三类。

  1. 非常重要的页面。这个桶里放那些对网站意义重大,并且质量较高的页面。
  2. 需要改善的页面。把那些需要进一步改善的页面放到这里。这些页面从质量上来说已经可以提交给搜索引擎,而不会被认定为低质量,因而不会对网站造成任何负面影响。但还不完全符合你的期望或要求,有进一步改善的空间。可以做进一步完善,然后重新发布。
  3. 低质量的页面。这个桶用来放那些离标准有相当差距的页面,但不要直接删除。尝试一下:在距标准差距最大的样本集里,挑选出部分页面,先将它们从站点中移除(确保保留了副本),接着观察在移除这些页面后,抓取预算、索引量、排名和搜索流量是否有所改善。做这样的练习,可以获得有建设性的经验。通过淘汰那些低质量的页面,很多时候可以看到谷歌给出了正面积极的反馈。

原文发布于微信公众号 - 互联网数据官(internetcdo)

原文发表时间:2017-10-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏不止思考

如何应对线上故障

线上故障是我们技术同学经常遇到,也是技术成长中经常要经历的事。从故障中我们可以吸取到很多教训,变得越来越有经验。

1982
来自专栏Java架构

Java分布式架构的演进过程

1946年,世界上第一台电子计算机在美国的宾夕法尼亚大学诞生,它的名字是:ENICAC ,这台计算机的体重比较大,计算速度也不快,但是而代表了计算机时代的到来,...

1986
来自专栏SDNLAB

SDN实战团分享(三十二):ZStack架构及其网络功能简介

先说些题外话 SDN 群里大牛很多,从平时讨论中学习到不少,我的背景相对更偏云计算一些,我对 SDN 的角度可能也与大家有一些不同。 举例来说,前段时间发生了...

5465
来自专栏云加头条

张青林:TXSQL是什么?云计算时代数据库核弹头

腾讯MySQL内核研发专家张青林在腾讯“云+未来”峰会的「开发者专场」做了主题为“TXSQL:云计算时代数据库核弹头”的技术内容分享,本次分享从五个方面介绍TX...

7032
来自专栏即时通讯技术

达达O2O后台架构演进实践:从0到4000高并发请求背后的努力

达达创立于2014年5月,业务覆盖全国37个城市,拥有130万注册众包配送员,日均配送百万单,是全国领先的最后三公里物流配送平台。 达达的业务模式与滴滴以及Ub...

2223
来自专栏Laoqi's Linux运维专列

饿了么的架构设计及演进之路(转)

1796
来自专栏智能计算时代

2017年终奉献:微服务最佳实践

关键需求 最大限度地提高团队的自主性:创建一个团队可以完成更多工作而不必与其他团队协调的环境。 优化开发速度:硬件便宜,人不是。 使团队能够轻松快捷地构建强大的...

3035

37 个你必须知道的现代数据中心术语

在今日的信息科技社会,现代数据中心这个术语越来越受到领导者的重视。云计算、闪存、软件定义网络(SDN)、容器,以及大量的编排及自动化工具。这些新型技术构成了现代...

26510
来自专栏知晓程序

深度解读!小程序新增能力意味着什么?

1533
来自专栏腾讯数据库技术

腾讯新一代企业级云数据库CynosDB(NewCDB)

NewCDB是在CDB十年技术和产品沉淀的基础上诞生的,腾讯云数据库产品在继承中不断完成突破。

7.6K6

扫码关注云+社区

领取腾讯云代金券