排名到底和谁相关?---论域名权威与品牌搜索量

本文长度为3094字,预估阅读时间10分钟。

引言:本文将带领读者探索排名相关性的研究。

翻译 | Nic

审校 | 王楠楠 编辑 | Rachel

以下文章仅代表作者个人观点,并不反映Moz的观点

两周前,我很高兴有机会在Search Love San Diego的活动上演讲。那次演讲的主题围绕“谷歌是否还重视链接?”该演讲着眼于谷歌在2017年会如何以及多大程度上将链接作为排名因素的已有证据,今天在此分享的研究结果也包括在上次演讲的内容中。

那次演讲的一个主要观点是,虽然链接仍然代表了Google排名算法里有效的信息来源,但除此之外,谷歌还拥有了很多其他的来源,而这些来源中的大多数在大约20年前PageRank被确定为网站知名度和权威性的代言时没有被考虑过。

这些新的信息来源之一是品牌搜索量,也是最容易获取的来源之一;所以我决定深入比较它与基于链接的指标的差异。这也为站外营销工作中需要重视的关键绩效指标(KPI)加入了一些有趣的解释 - 因为品牌知名度和链接建设往往是两个相互冲突的目标。

为了清晰起见,品牌搜索量是指排名网站的品牌的月度区域搜索量。例如,对于页面https://www.walmart.com/cp/Gift-Cards/96894 来说,即为“沃尔玛”一词在美国的月度搜索量(由Google关键字规划师提供)。我曾经写过一些关于如何归纳该数据集,并与边界案例进行处理的内容。

在选择用来比较基于链接的度量标准时,Domain Authority(域名权威)似乎是很自然并且公正的选择 – 因为它属于域级别,通常被用来衡量品牌搜索量的精度水平,并且在Moz对域级链接因素的研究中排名第一(https://moz.com/search-ranking-factors/correlations#6)。

关于相关性研究的说明

在近一步探讨前,有个关于相关性研究的小提醒:别因小失大。

打比方说,域名权威(或品牌搜索量,或任意其他参数)与排名之间正相关的事实足以指出以下任何一点:

* 链接对网站排名好坏有很大正面影响

* 好的排名会帮助网站获得更多链接

* 一些第三方因素(例如网站的声誉或时长)可以帮助网站同时获得更多链接和更高排名

这并不是说相关性研究毫无用处 - 它帮助我们理解的更充分,并将研究提升到更高层面;而不仅仅是简单将其作为是否成为排名因素的一个最终判断。

方法论

上面引用的Moz研究使用了Google Keyword Planner中所有22个顶级类别中提供的800个样本关键字,以及每个关键字的前50个结果。 删除重复数据后,还有16,521个查询。 Moz仅查看了网页结果(无图像,回答框等),忽略了那些结果少于25条的查询,并采用了桌面排名(据我观察到的)。

我采取了一种稍微不同的方法。 我请求STAT提供5000个美国市场的非品牌关键字的样本。 与Moz相同的是,我排除了非网页结果;不同在于,基础排名在10以下的结果也被排除(基础排名是STAT排除非网页结果时排列搜索结果的方式)。你可以在这里看到STAT的输出。

Moz使用了Mean Spearman相关性,这个过程考虑了每个关键词的排名变量,然后权衡所有关键词的平均相关。 我也选择了这种方法,下面的例子解释这样做的原因:

对于关键字A,前5个搜索结果的品牌搜索量有较大幅度的变化。这意味着即使搜索结果按搜索量顺序排列,搜索量和排名并没有显著的相关性。

Moz是如何来避免这一问题的呢?它比较了排名位置(表格中的第二列)和表格最右侧的列 - 每个网站如何排列既定变量。在这种情况下,将排名与搜索量直接关联将产生 - 0.75的相关性。与搜索量排名是几乎1的完美相关性。

接着对样本中的每个关键字重复此过程(同一关键字的桌面和移动版本视为两个关键字),然后采用平均相关性。

定义品牌搜索量

最初,我认为对样本中的每个网站拉取品牌搜索量,就只需要简单地从其域的搜索量中排除其子域和TLD(顶级域名)的搜索量(例如https://www.walmart.com/cp/Gift-Cards/96894的“walmart”)。 但是,事实证明这远远不足。 举例来说:

这些网站的品牌分别是“cruise”,“wordpress”和“sd”吗? 显然不是。 为了弄清楚品牌搜索词是什么,我首先从URL中获取每个潜在候选词,以e-cotalker.wordpress.com为例:

* Ecotalker

* Ecotalker wordpress

* Wordpress.com

* WordPress

然后,我整理出子域名排名第一的最高搜索量是什么 - 这个例子中,“Ecotalker”和“Ecotalker wordpress”表现相差无几,两者的搜索量都显示为零。

我非常重视Google在搜索量查询中的同义词匹配,以便捕捉任何边缘案例 - 例如,我相信“ecotalker.wordpress”会显示与“ecotalker wordpress”相同的搜索量。

你可以在这里查找到关于子域的域名权重和品牌搜索量的结果数据集(https://docs.google.com/spreadsheets/d/1CNPQhKAOrIvh_23dRocnoiSmTjrxWt2abwo6IEhyPPo/edit?usp=sharing) (我再一次使用了STAT来批量提取搜索量。)

结论:品牌搜索量>排名

这揭示了:与域名权威相比,排名与品牌搜索量更相关性。

但是,还有其他一些关注点。首先,这些变量与排名之间并不存在特别的强相关性 - 假设完美的相关性为1,我发现域名权威与排名之间的相关性仅为0.071,品牌搜索量与排名的相关性大约为0.1。

根据Moz研究的标准,这是非常低的,该研究使用相同的统计方法发现域名权威与排名之间的相关性为0.26。

我想最大的区别就是Moz对每个查询使用50个网页结果;相比之下,我使用10个网页结果。如果这是真的,这意味着相比在首页的排名结果而言,域名的权威度更多影响到的是怎样让网站进入搜索结果的前几页中。

另一个潜在的区别在于两个样本中的关键字类型。 Moz的研究对搜素量在0-10k,10k-20k,20k-50k和50k +的关键字进行了相当均匀的分布:

另一方面,我的关键字更偏向低端:

但是,这似乎不是较低相关性的原因。请仅查看我的数据集中关于高容量关键字(10k +)排名的相关性:

尽管这两个度量标准展示的相关性非常接近,但总体相关性仍然远不及Moz的高,因此我将这一差异更多地归因于他们使用50个排名位置而不是关键字本身。

值得注意的是,我的高搜索量查询的样本量仅为980。

回归分析

观察两个变量之间关系的另一种方法是看一个变量的变化在多大程度上是因另一个变量而触发的。例如,我们示例中的页面平均排名为5.5。如果我们有一个排名在第7位的特定页面,并且模型预测它会排在第6位,则平均排名(对于该特定页面)解释了其33%的变化。

使用上面的数据,我构建了许多模型来预测样本中页面的排名,然后绘制了下面这些模型解释的方差比例(点击这里https://en.wikipedia.org/wiki/Coefficient_of_determination阅读更多关于此度量的信息,通常称为R平方)。

一些解释:

•排名网站的品牌搜索量 - 如上所述

•日志(品牌搜索量) - 品牌搜索量的日志与域名权威间更公平的比较,例如,一个DA是 40的网站的链接次数超过DA 20网站的两倍。

•排名品牌搜索量 - 如上所述,网站的品牌搜索量与其他网站相同的关键字的搜索量之间的比较。

首先,值得注意的是,尽管R平方非常低,但上面列出的所有变量在统计上都具有很高的显著性。

然而真正有趣的一点是,在同一模型中排名的域名权威和排名品牌搜索量,解释了比排名品牌搜索量更多的变化。

要明确的是:几乎所有的排名变化,我们既可以参考域名权威来解释,也可以参考品牌的搜索量来解释。但反之并非如此。

数据很好,但为什么要关注?

这里有两个要点:

1.如果你关心你的域名权威,因为它与排名相关,那么同时也要考虑品牌搜索量。

2.链接和排名之间的相关性有时可能有点类似“红鲱鱼谬误” - 可能是链接本身仅与更好地解释了排名的第三个因素相关。

注:红色鲱鱼谬误(redherring),即转移话题谬误,是将一个不相干的话题插进来,从而把读者或者听众的注意力转移到另一个论题上,赢得论战。

围绕这两组相关性有多弱(如果统计意义显著)也有一些值得关注的地方。这更强调相关性和意图,这可能是对整体的更好的补充。

如果你打算通过内容制作以建立更多链接,或者如果在不久的将来阅读帖子或观看围绕此或任何其他链接构建技术的演示文稿时,可以参考Tomas Vaitulevicius在11月份时提出的一些有趣问题。 尤其是如果寄望于通过制作内容以获得更多链接和更高品牌知名度,它可能不是一个对两者都有效的方法,因此需要找到更合适的方法并取得平衡。

我并不会说“链接都是无效的”或类似的话,我们更需要用审视的眼光看待问题:为什么,以及在什么情况下它们显得尤为重要。需要强调的是,我认为这对那些有更多竞争的短语的第一个结果页的影响会越来越被降低,很希望看到你们在评论区留下新颖有趣的想法。

我也很想看到更多类似的分析。 与任何研究一样,交叉检验和复制研究是相当重要的一步。

无论哪种方式,我都会继续围绕这个话题发表我的想法,敬请各位关注!

关于Tom.Capper – Distilled London的高级顾问。

原文发布于微信公众号 - 互联网数据官(internetcdo)

原文发表时间:2018-05-16

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能快报

麻省理工开发出低功耗语音识别技术

自动语音识别技术在十多年之前还难登大雅之堂,但现在它正成为人们和主要计算设备之间进行交互的主要手段。 据麻省理工学院报道,该院的研究人员已成功开发出了自动语音识...

2915
来自专栏CSDN技术头条

软件看板之父David Anderson:使用看板方法进行项目管理

一、使用看板方法管理项目 我是项目经理,看板对我来说意味着什么? 我是项目经理,我的组织正在采用Kanban,它对我意味着什么?以及我应该在工作中如何使用看板?...

2309
来自专栏AI研习社

OpenAI 发布完整版游戏强化学习研究平台 Gym Retro

我们发布了用于游戏研究的强化学习平台完整版 Gym Retro,支持的游戏从大约 70 多个雅达利和 30 多个世嘉游戏扩展到各种仿真器支持的 1000 多个游...

1273
来自专栏人人都是极客

浅谈网络语音技术

当我们使用像Skype、QQ这样的工具和朋友流畅地进行语音视频聊天时,我们可曾想过其背后有哪些强大的技术在支撑?本文将对网络语音通话所使用到的技术做一些简单的介...

1672
来自专栏吉浦迅科技

英伟达DesignWorks VR用虚拟现实做现实世界的设计

英伟达(NVIDIA)发布了DesignWorks VR,一套新的工具配合之前推出的GameWorks VR SDK一起使用,聚焦代替在虚拟现实里创建物理对象。...

2756
来自专栏Forrest随想录

AI时代,我们离AIOps还有多远?

AI时代,AIOps热炒,这篇算是蹭个热点:)。回到本行,我们运维应该关心的是什么:

1212
来自专栏新智元

机器学习项目实践:30+ 必备数据库(预测模型、图像分类、文本分类)

【新智元导读】有了好的数据,机器学习项目也就成功了一半。希望这份资源清单有助于那些寻找机器学习项目实践的人。对于初学者来说,这绝对是一个金矿。确保你在业余时间选...

3776
来自专栏CVer

重磅 | 《动手学深度学习》 0.7版发布

学过或正在学习MXNet框架的同学,一定很熟悉《动手学深度学习》这个课程。该课程算是第一个最硬国语版讲解深度学习的课程(从理论到实战)。Amusi记得该课程首次...

790
来自专栏无原型不设计

交互设计流程是怎样的?

尽管“交互设计”在近几年的设计行业中早已不是什么新鲜名词,但依然还是有很多朋友,尤其是刚入行的新人会问:什么是交互设计?交互设计师到底是干嘛的?交互设计的流程...

4525
来自专栏BestSDK

5个要点,决定你的交互设计是否成功!

交互设计(Interaction Design):定义、设计人造系统的行为的设计领域。人造物,即人工制成物品,例如,软件、移动设备、人造环境、服务、可佩带装置以...

3467

扫码关注云+社区

领取腾讯云代金券