前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >极为重要的基础知识!剖析Google Analytics报告中的Scope(范围)

极为重要的基础知识!剖析Google Analytics报告中的Scope(范围)

作者头像
iCDO互联网数据官
发布2018-03-02 16:44:12
1.8K0
发布2018-03-02 16:44:12
举报

编译:互联网数据官 梅子

我们都知道,Google Analytics(后文统称为GA)让不懂数据背后的处理逻辑的人也能很容易的收集和查看数据。通常情况下,理解了GA收集和存储数据的模型,就会很好解释一些复杂问题或者古怪的访客行为。下面就从最基本的说起:

GA的数据收集可以分成两类:维度和指标。然而,并不是每一个维度-指标的组合都可以在GA标准报告中进行分析。例如,“所有页面”报告提供的是关于网站不同网页的详细信息,你可以这个报告中看到网页浏览量、唯一身份浏览量,以及每一个页面的访问进入次数、平均页面停留时间、跳出率、退出率和网页价值等指标。但是你看不到用户数或者会话数这样的指标。

关于会话和用户指标的数据到底在哪里?

你使用GA的目的就是想尽可能地了解关于网站表现的信息,那么为什么这些额外的指标并没有出现在表格里呢?这看起来像是标准报告的限制,但是这些指标其实是故意遗漏掉的。了解这些指标为什么会被遗漏是创建有意义和准确的报告的关键。

什么是Scope(范围)?

基于GA定义和收集数据的模式,维度和指标是各自被分开储存的。Scope是每个维度和指标的一个特性, 每个维度或者指标只能有一个Scope。GA数据是由以下4个类型的Scope组成的:

1. 用户数据

2. 会话数据

3. Hit数据

4. 产品数据(电子商务)

Hit的定义是指网站上的任何一个单一操作,例如网页浏览或者由观看视频或下载PDF而触发的事件。Hit同时也与产品相关联。

会话则是在特定时间区间内的一个或多个hits。一个用户在一个会话内,在网站上的所有操作,如加载的页面和下载的文件,都是与这个会话相关联的。

用户数据是数据收集的最高级别,并且是连接过去和未来网站行为的关键点。具体说来,GA会为访问你网站的每个用户存储一个客户端ID,然后将同一客户端ID的会话聚集在一起。这个客户端ID是GA跟踪代码生成的一个值,且储存在用户电脑的浏览器cookie中。需要说明的是这里的用户并非是一个人的意思,指的是cookies,理解这点对于报告的分析是至关重要的。因此,如果一个人在工作时通过Chrome访问了一个网站,然后在家里的电脑上通过Firefox浏览器又访问了一次同一网站的话,会被计算成是两个用户,因为每个浏览器各自产生一个cookie。

用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则可能会跟一个或者多个产品相关联。

  • 用户级Scope

用户级Scope内的任何维度或指标都与用户相关,最常用的包括:

维度

指标

用户类型

用户数

会话次数

新用户数

地理位置

  • 会话级Scope

会话级Scope的维度和指标指的是单次会话的属性,包括:

维度

指标

着陆页

会话数

来源/媒介

跳出率

广告系列

平均会话时长

  • Hit级Scope

Hit级Scope的维度和指标指的则是单次Hit的特性,包括:

维度

指标

页面

页面浏览数

主机名

页面停留时间

事件分类

事件总数

为什么Scope很重要?

如上述,用户是由一个或者多个会话组成的,会话是由一个或多个Hit组成的,Hit则会关联至一个或多个产品。理解这种层次结构的方向性是非常重要的。例如,我们可以说,会话包括Hit,但Hit不能包括会话,Hit匹配到产品,但不会反过来说产品匹配到Hit。然而,Hit是包含用户的,要理解为什么Hit可以包含用户却不能包括会话,我们需要分解一下GA数据的处理步骤。

Hit是GA的基本单位。一个客户端ID是由大量包含很多其他信息的Hit组成的,这些信息包括Hit的类型(页面浏览、事件等),Hit产生的时间等。Hit是发送到GA的需要被处理的碎片化信息。根据在数据视图设置的过滤器,有些Hit会被保留,有些则会被丢弃。Hit是根据时间戳按先后顺序组织的,并且通过客户端ID而关联起来。只有这样,GA才能通过这些Hit的间隔时间来确定他们属于哪个会话。

这样处理的结果就是,Hit并没有一个会话ID可以分配,虽然我们可以说“Hit包含用户数据”,因为Hit包含客户ID的信息;但不能说“Hit包含会话数据”,因为它并不包含会话的信息。即使有方法可以把Hit和会话连接起来,Hit级报告也会出现重复信息。因此,Hit和会话级别的报告是不兼容的,故我们说“Hit不包含会话数据”。

基于此,在做数据报告以及设置自定义维度和指标的时候,你应当将Scope考虑在内。

报告

一谈到报告,Scope就显得特别地重要。如上所述,GA的内置报告不允许创建无效的维度-指标组合。然而,如果是创建自定义报告或者通过API创建报告,那么限制就少很多了,你可以任意组合想要的维度或指标,但这并不一定是件好事情。

创建报告时首先需要弄清一件事,即就GA收集数据的方法来说,这个自定义的维度-指标的组合真有意义吗?否则,你可能会创建出一些与你的想象不一致的报告。

例如,如果你试图将GA里的“网页”和“会话”组合在一起,生成的表格并不会显示该网页被浏览的会话数,而是显示有多少个会话是从这个页面进入的。为了得到想看的信息,你需要将“网页”和另一个Hit级维度组合起来,例如“唯一页面浏览量”。

在组合任何Hit级维度和会话级指标时,该指标都只会包含会话的第一个Hit的数据。在这里将列举一些在做报告时可能会犯的错误。

以下是你无法设置的一些组合:

  • 事件和目标达成数

你也许想知道有多少事件被算成目标达成数。一个目标可以被定义为一个事件,但不能把它和目标达成数关联起来,因为目标是会话级的,而事件是Hit级的。

  • 产品和事件总数

你可能对有多少人购买了产品并完成了一个事件感兴趣。这种情况下比较每个Hit级的产品级数据是不可行的,这种组合只会产出没有数据的报告。

  • 页面和目标达成数

你或许还会对另一块信息有兴趣,那就是目标是在哪些页面完成的。你可以通过维度、目标达成URL看到某些层级的详细信息,但是你不能将页面维度和目标达成数量指标组合起来。此分析以及上述的事件-目标达成数的组合不可行的原因是相同的,即:目标是会话级别的,而页面是Hit级别的。不过,你可以利用转化细分来分析这类数据。

总之,基于GA定义和处理数据的方式,这些维度和指标的组合生产出来的报告都是无意义的。

自定义维度和指标

在设置自定义维度和指标的时候,特别需要考虑到Scope,当然你也可以为它们设置Scope。

设置的Scope可以建立在你希望如何收集这些数据以及最终如何汇报这些数据上。这些信息是否只和当前的Hit有关?它是否会提供我们更多关于浏览会话的信息?或者它是否会提供一些值得保留的用户信息?这些疑问都可以通过自定义维度和指标产生的报告找到答案。

例外情况

正如上文提及的,跨Scope地组合维度和指标是绝对会产生误导的。要不得到的是完全没有意义的报告,要不就是会得到和期望大相庭径的报告。但是有时候,你确实能从里面得到所期望的报告。

例如,如果你创建了Hit级维度(页面)和用户级指标(用户数)的自定义组合,那么你就能得到每个页面被多少用户访问过的报告。如果你记得我之前说的,Hit确实包含用户信息(客户端ID),那么这就是这种组合可行的原因。

主要结论

谨记:做报告的时候千万不要跨Scope——如果你要跨Scope组合,先考虑好它们之间的层级关系。同时,把跨Scope报告与GA中的其他数据进行交叉参考,以确保报告展示内容确实是你想要的。记住GA是如何处理数据的——每个Hit都有一个客户ID,但是没有会话 ID。还有个原则是,千万不要组合Hit级和会话级的指标。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2017-01-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 DigiMax 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档