【重磅干货】三个步骤,用GA分析流量异动的原因

本文长度为1381字,预估阅读时间4分钟

引言:今天孙维老师将为我们带来流量异动分析的精彩干货,让我们一起来细细品读。

作者|孙维

编辑|Cici

当遇到流量异常变化时,分析师或产品经理往往需要放下手里的工作,马上去排查原因。而在这个过程中,总的来说需要三个步骤:

  • 发现异常流量特征
  • 将异常流量“提纯”
  • 分析异常流量的成因

第一步我们要找到异常流量,为了提升这个工作的效率,我总结了一套清单,希望能作为大家的工作手册使用。我先列出清单中的项目,后文再详细解释:

流量异常维度速查清单

▲▲▲

  • 分小时对比异常和正常的两天,分别对比UV/会话/PV等指标
  • 如果有其他流量统计系统,互相验证数据准确性 如果个别小时流量变动明显:
  • 确定异常时间段,去找技术部同事排查问题(如果可能,先在域名报告、所有页面、内容分组报告里聚焦到出问题的某部分页面,方法见后)
  • 去找运维部同事查询,异常时段内的http请求数是否也异常(如果是,说明流量实际上确实变了;如果否,可能是统计代码本身出问题,实际流量并没变化)
  • 去找产品/运营的同事询问是否有产品改版,或是组织了什么在线活动 如果异常是均匀分布在各小时中,就要去查各个维度上,是否存在异常突出的项目,那可能就是出问题的点:
  • 流量来源
  • 新/老用户
  • 着陆页
  • 所有页面(组)
  • 事件
  • 省份/城市
  • 浏览器/操作系统
  • 手机品牌/型号(移动端访客)
  • 上网运营商

常见的三种异常情况

▲▲▲

  • 断崖式:下跌时段如此明显,接下来我们可以直接到域名或所有页面报告中,很容易的定位到下跌的页面,然后去找技术和运维的同事排查问题即可。
  • 个别小时小幅度异常

与明显的断崖式下跌相比,如果只是个别小时疑似下跌,是不太容易定位到下跌的域名/页面的,因为缺失的流量被全天的数据“稀释”了。但是还好,GA有强大的高级细分功能,我们可以单独看下跌的那个小时的数据。这个过程就是本文开头提到的“将异常流量提纯”:

经过高级细分之后再去看域名报告,我们就能很明显的定位下跌的部分了:

发现异常域名后进一步,在次级维度中调出着陆页,就能更精准的找到出问题的页面:

在其他流量统计系统中可能也会有类似的细分功能,总之思路是相通的,就是找到有异常的维度,然后用它做细分条件,提取出问题最集中的那部分流量。

  • 全天候均匀下跌

有时候出问题的维度不是小时,例如下面这个例子:

我们发现so.com来源的流量明显下降了,但是在小时维度数据上是比较均匀分布的:

于是这次我们不在小时上做细分,而是建立一个“so.com来源”的细分,完成异常流量的“提纯”工作,接下来就要分析异常的成因了。这个过程其实也简单,只要带着“提纯”用的高级细分,到各个报告中去寻找其他维度的异常即可。

结果是,我们在“浏览器”报告中发现只有Vivo系统浏览器数据变动很大,然后我们继续用次级维度细分该浏览器带来的流量来源,结果发现随着so.com来源的降低,百度的流量基本在同等增加,那么原因就比较明显了,非常可能是这个浏览器将搜索框里原本导给so.com的那些流量切到了百度。

分析系统之外还有什么工作

▲▲▲

前文中的方法能够应对大部分流量异常的情况了,但如果异常数据在任何维度都是平均分布的,找不到异常点怎么办?这时候可以先打开网站/App看一下,有时候问题就摆在那里很容易发现。

另外还可以考虑一下外部因素,例如学生开学可能导致游戏相关流量下降,周末如果赶上大范围的重雾霾天气可能导致娱乐类流量上升(用户们都宅在家了),我们甚至还遇到过《焦点访谈》的一个镜头中出现了我们的品牌,导致来访流量大涨。寻找这些外部因素没有一定之规,能否找到也要看一点运气了。

关于作者

孙维,卡车之家数据资产中心总监,互联网从业15年,数据分析从业6年老兵。Google Analytics资深使用者,「数据分析日常」公众号博主

原文发布于微信公众号 - 互联网数据官(internetcdo)

原文发表时间:2018-09-27

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

数据科学的十大常见误区 你中枪了吗?

原作者 Shane Brennan 编译 Mika 本文为 CDA 数据分析师原创作品,转载需授权 对于数据科学领域的新手来说,以下的十大常见误区每一条都是血...

2677
来自专栏云计算D1net

混合云:如何优化企业网络设计

公有和混合云引入给企业网络设计带来了重大影响。新的瓶颈出现了,并且一些企业需要改变它们的网络配置——特别是广域网的配置——来确保能够得到所需的性能。 特别是在混...

2948
来自专栏非著名程序员

处境艰难的 App 开发者们如何自救

这是我朋友的公司不再研发原生 App 的原因——在网页端创业简单的多。怎么会这样呢?基于浏览器的网页端生态系统已经存在了 20 多年,而 App 系统却仅存世 ...

2207
来自专栏跨界架构师

如何一步一步用DDD设计一个电商网站(一)—— 先理解核心概念

    DDD(领域驱动设计)的一些介绍网上资料很多,这里就不继续描述了。自己使用领域驱动设计摸滚打爬也有2年多的时间,出于对知识的总结和分享,也是对自我理解的...

1532
来自专栏企鹅号快讯

关键词搜索工具分享

Wordtracker关键词搜索工具分享 打开网站,大家可以看到这个界面,直接在搜索框输入产品关键词,可以看到一些关键词,但是关键词的数量并不多。 ? 需要看到...

22410
来自专栏PPV课数据科学社区

如何用Python一门语言通吃高性能并发、GPU计算和深度学习

有奖转发活动 回复“抽奖”参与《2015年数据分析/数据挖掘工具大调查》有奖活动。 为了帮助IT从业者职业之路拥有更多收获,在诸多C粉的殷切期待下,由 CTO俱...

4277
来自专栏喔家ArchiSelf

Rethinking IoT

在地铁阅读时光里读完了《重构物联网的未来》一书,稍感失望。该书的英文原著书名为:《Rethinking The Internet of Things-- A S...

914
来自专栏华章科技

从大数据中挖掘什么?

大数据挖掘中最重要的是决定挖掘什么样的知识,这是在数据的收集、处理、挖掘的整个过程中都需要认真考虑的问题。本文首先提出大数据挖掘的几项策略,即尽量设想挖掘的场景...

522
来自专栏美团技术团队

从Google白皮书看企业安全最佳实践

前不久Google发布了一份安全方面的白皮书Google Infrastructure Security Design Overview,直译的版本可以参考“网...

4965
来自专栏云计算D1net

使用EFSS规避消费级云存储风险

许多使用消费级云存储产品的公司都面临着不同程度的安全风险,因此企业可以尝试采用IT部门和普通员工都能够接受的企业级文件同步和共享解决方案。 IT部门需要在提供服...

2796

扫码关注云+社区