极为重要的基础知识!剖析Google Analytics报告中的Scope(范围)

编译:互联网数据官 梅子

我们都知道,Google Analytics(后文统称为GA)让不懂数据背后的处理逻辑的人也能很容易的收集和查看数据。通常情况下,理解了GA收集和存储数据的模型,就会很好解释一些复杂问题或者古怪的访客行为。下面就从最基本的说起:

GA的数据收集可以分成两类:维度和指标。然而,并不是每一个维度-指标的组合都可以在GA标准报告中进行分析。例如,“所有页面”报告提供的是关于网站不同网页的详细信息,你可以这个报告中看到网页浏览量、唯一身份浏览量,以及每一个页面的访问进入次数、平均页面停留时间、跳出率、退出率和网页价值等指标。但是你看不到用户数或者会话数这样的指标。

关于会话和用户指标的数据到底在哪里?

你使用GA的目的就是想尽可能地了解关于网站表现的信息,那么为什么这些额外的指标并没有出现在表格里呢?这看起来像是标准报告的限制,但是这些指标其实是故意遗漏掉的。了解这些指标为什么会被遗漏是创建有意义和准确的报告的关键。

什么是Scope(范围)?

基于GA定义和收集数据的模式,维度和指标是各自被分开储存的。Scope是每个维度和指标的一个特性, 每个维度或者指标只能有一个Scope。GA数据是由以下4个类型的Scope组成的:

1. 用户数据

2. 会话数据

3. Hit数据

4. 产品数据(电子商务)

Hit的定义是指网站上的任何一个单一操作,例如网页浏览或者由观看视频或下载PDF而触发的事件。Hit同时也与产品相关联。

会话则是在特定时间区间内的一个或多个hits。一个用户在一个会话内,在网站上的所有操作,如加载的页面和下载的文件,都是与这个会话相关联的。

用户数据是数据收集的最高级别,并且是连接过去和未来网站行为的关键点。具体说来,GA会为访问你网站的每个用户存储一个客户端ID,然后将同一客户端ID的会话聚集在一起。这个客户端ID是GA跟踪代码生成的一个值,且储存在用户电脑的浏览器cookie中。需要说明的是这里的用户并非是一个人的意思,指的是cookies,理解这点对于报告的分析是至关重要的。因此,如果一个人在工作时通过Chrome访问了一个网站,然后在家里的电脑上通过Firefox浏览器又访问了一次同一网站的话,会被计算成是两个用户,因为每个浏览器各自产生一个cookie。

用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则可能会跟一个或者多个产品相关联。

  • 用户级Scope

用户级Scope内的任何维度或指标都与用户相关,最常用的包括:

维度

指标

用户类型

用户数

会话次数

新用户数

地理位置

  • 会话级Scope

会话级Scope的维度和指标指的是单次会话的属性,包括:

维度

指标

着陆页

会话数

来源/媒介

跳出率

广告系列

平均会话时长

  • Hit级Scope

Hit级Scope的维度和指标指的则是单次Hit的特性,包括:

维度

指标

页面

页面浏览数

主机名

页面停留时间

事件分类

事件总数

为什么Scope很重要?

如上述,用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则会关联至一个或多个产品。理解这种层次结构的方向性是非常重要的。例如,我们可以说,会话包括Hit,但Hit不能包括会话,Hit匹配到产品,但不会反过来说产品匹配到Hit。然而,Hit是包含用户的,要理解为什么Hit可以包含用户却不能包括会话,我们需要分解一下GA数据的处理步骤。

Hit是GA的基本单位。一个客户端ID是由大量包含很多其他信息的Hit组成的,这些信息包括Hit的类型(页面浏览、事件等),Hit产生的时间等。Hit是发送到GA的需要被处理的碎片化信息。根据在数据视图设置的过滤器,有些Hit会被保留,有些则会被丢弃。Hit是根据时间戳按先后顺序组织的,并且通过客户端ID而关联起来。只有这样,GA才能通过这些Hit的间隔时间来确定他们属于哪个会话。

这样处理的结果就是,Hit并没有一个会话ID可以分配,虽然我们可以说“Hit包含用户数据”,因为Hit包含客户ID的信息;但不能说“Hit包含会话数据”,因为它并不包含会话的信息。即使有方法可以把Hit和会话连接起来,Hit级报告也会出现重复信息。因此,Hit和会话级别的报告是不兼容的,故我们说“Hit不包含会话数据”。

基于此,在做数据报告以及设置自定义维度和指标的时候,你应当将Scope考虑在内。

报告

一谈到报告,Scope就显得特别地重要。如上所述,GA的内置报告不允许创建无效的维度-指标组合。然而,如果是创建自定义报告或者通过API创建报告,那么限制就少很多了,你可以任意组合想要的维度或指标,但这并不一定是件好事情。

创建报告时首先需要弄清一件事,即就GA收集数据的方法来说,这个自定义的维度-指标的组合真有意义吗?否则,你可能会创建出一些与你的想象不一致的报告。

例如,如果你试图将GA里的“网页”和“会话”组合在一起,生成的表格并不会显示该网页被浏览的会话数,而是显示有多少个会话是从这个页面进入的。为了得到想看的信息,你需要将“网页”和另一个Hit级维度组合起来,例如“唯一页面浏览量”。

在组合任何Hit级维度和会话级指标时,该指标都只会包含会话的第一个Hit的数据。在这里将列举一些在做报告时可能会犯的错误。

以下是你无法设置的一些组合:

  • 事件和目标达成数

你也许想知道有多少事件被算成目标达成数。一个目标可以被定义为一个事件,但不能把它和目标达成数关联起来,因为目标是会话级的,而事件是Hit级的。

  • 产品和事件总数

你可能对有多少人购买了产品并完成了一个事件感兴趣。这种情况下比较每个Hit级的产品级数据是不可行的,这种组合只会产出没有数据的报告。

  • 页面和目标达成数

你或许还会对另一块信息有兴趣,那就是目标是在哪些页面完成的。你可以通过维度、目标达成URL看到某些层级的详细信息,但是你不能将页面维度和目标达成数量指标组合起来。此分析以及上述的事件-目标达成数的组合不可行的原因是相同的,即:目标是会话级别的,而页面是Hit级别的。不过,你可以利用转化细分来分析这类数据。

总之,基于GA定义和处理数据的方式,这些维度和指标的组合生产出来的报告都是无意义的。

自定义维度和指标

在设置自定义维度和指标的时候,特别需要考虑到Scope,当然你也可以为它们设置Scope。

设置的Scope可以建立在你希望如何收集这些数据以及最终如何汇报这些数据上。这些信息是否只和当前的Hit有关?它是否会提供我们更多关于浏览会话的信息?或者它是否会提供一些值得保留的用户信息?这些疑问都可以通过自定义维度和指标产生的报告找到答案。

例外情况

正如上文提及的,跨Scope地组合维度和指标是绝对会产生误导的。要不得到的是完全没有意义的报告,要不就是会得到和期望大相庭径的报告。但是有时候,你确实能从里面得到所期望的报告。

例如,如果你创建了Hit级维度(页面)和用户级指标(用户数)的自定义组合,那么你就能得到每个页面被多少用户访问过的报告。如果你记得我之前说的,Hit确实包含用户信息(客户端ID),那么这就是这种组合可行的原因。

主要结论

谨记:做报告的时候千万不要跨Scope——如果你要跨Scope组合,先考虑好它们之间的层级关系。同时,把跨Scope报告与GA中的其他数据进行交叉参考,以确保报告展示内容确实是你想要的。记住GA是如何处理数据的——每个Hit都有一个客户ID,但是没有会话 ID。还有个原则是,千万不要组合Hit级和会话级的指标。

原文发布于微信公众号 - 互联网数据官(internetcdo)

原文发表时间:2017-01-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏程序员笔记

钉钉机器人

80650
来自专栏即时通讯技术

以网游服务端的网络接入层设计为例,理解实时通信的技术挑战1、前言2、相关文章3、主流网游的网络通信架构原理4、题外话:该如何理解C/M架构?5、网络接入层的作用6、网络接入层的通信协议选择7、网络接入

以现在主流的即时通讯应用形态来讲,一个完整的即时通讯IM应用其实是即时通信(英文简写:IM=Instant messaging)和实时通信(英文简写:RTC=R...

12620
来自专栏即时通讯技术

以网游服务端的网络接入层设计为例,理解实时通信的技术挑战

以现在主流的即时通讯应用形态来讲,一个完整的即时通讯IM应用其实是即时通信(英文简写:IM=Instant messaging)和实时通信(英文简写:RTC=R...

22230
来自专栏牛客网

腾讯北京SNG一面

写在前面 面试官超nice,以一种聊天的形式跟你交流。上午10点10左右开始,11点40结束。总的来说,基础还可以,但是有些东西的底层学的还是不够深。 问题回忆...

69450
来自专栏流柯技术学院

性能测试之吞吐量

我们每天的生活中都在用水用电,我只会关心自己的水管是否有水,水压是否稳定,如果我们把水龙头拧到最大,还是一滴一滴的流水。那我们就要愤怒了,直接找房东问明情况。我...

49440
来自专栏用户画像

2.3.1 中继器

中继器又称为转发器,主要功能是将信号整形并放大再转发出去,以消除信号由于经过一长段电缆,因噪声或其他原因而造成的失真和衰减,使信号的波形和强度所需要的要求,来扩...

8430
来自专栏开源优测

从0到1:测试工程师应该具备的基本功底

今天就测试基础知识进行分享,从几个层面来分享软件测试从业者应该具备什么样的基本功底。 笔者针对测试从业者必须掌握的基本功做了个分层: 1、操作系统层 在这个层面...

300100
来自专栏开源优测

从0到1:测试工程师应该具备的基本功底

今天就测试基础知识进行分享,从几个层面来分享软件测试从业者应该具备什么样的基本功底。 笔者针对测试从业者必须掌握的基本功做了个分层: 1、操作系统层 在这个层面...

29360
来自专栏Java架构

这些分布式知识,BAT的架构师都在用!

前一段时间在网上看见了一篇文章内容大致是作为一个架构师你需要拥有什么样的能力,其中不过是包括以下几个点:

44570
来自专栏开源优测

从0到1:测试工程师应该具备的基本功底

注: 本文来源自小密圈内部分享,更多精彩请加小密圈 今天就测试基础知识进行分享,从几个层面来分享软件测试从业者应该具备什么样的基本功底。 笔者针对测试从业者必...

371140

扫码关注云+社区

领取腾讯云代金券