8.1、用户数据与后台的获取与打通

GA数据与后台数据的来源、获取和打通

我们知道Google Analytics非常强大,只要添加一段基础跟踪代码就能够获得丰富的图标报告,但是你知道里面是数据是怎么来的?怎么获取的吗?

GA里面的数据通过跟踪代码获取的,当网页打开,跟踪代码被加载的时候,生成一个第一方cookie,里面会有个clientid,用于识别访客的表示,然后通过虚拟一像素的形式发送给GA服务器,也就是上面的collect形式的,上面有非常多的参数,不同的参数就代表部署的数据、标签了。

但是,并不是所有的数据都是通过跟踪代码就能够获取得到的,特别是受众特征和兴趣的数据,是需要通过第三方获取的,比如第三方Doubleclick Cookie、Android广告id、IOS广告识别符(IDFA),具体的如下:

analytics.js 和 AMP 跟踪都不收集受众特征和兴趣数据。如果你想看这些数据的话,你需要做其他的一些设置,具体的看一个完整的部署案例

在GA里面,我们可以将所有的数据理解为一张表,如右侧的表,clientID、用户属性(实际情况比这个复杂得多的,这个是为了简化理解抽象出来的结构)。

而对于后台数据,是存储在我们自己的数据库的,一般是通过日志或Post/Get的形式去获取,入库的,用户在注册的时候,我们会在后台生成一个带有ID的记录,一条记录就代表一个注册用户,体现的表格形式与GA的是相同的。

更多关于网站分析数据来源的可以看:网站数据来源

可以看到上面GA和后台数据在结构上是两个完全不同的表格来的,那么我们就需要一个字段,也就是外键将其关联起来,从而实现GA数据和后台数据的打通,这个外键就是Userid了,具体的原理如下:

用户在注册的时,生成id的时候通过生成一个hash值,也就是userid,然后放到页面上去,然后在用GTM去转成GA里面的自定义维度了,这样就可以将GA数据和后台数据打通,具体操作演示请看:如何将GA的userid与自己的CRM或后台数据打通。 如何打通不同平台的同一用户

如果一个用户在不同的平台或终端访问,我们怎么识别呢?

答案是不能的 如果一个用户在不同的平台或终端登录,我们怎么识别呢? 答案是可以 上面的两个问题,唯一的差别就是用户是否有登录,只有登录的用户才可以通过userid去识别跨平台,跨终端的用户,如果没有登录是能识别到的。这是因为在没登录之前,用户切换中断的时候,会生成一个新的clientid,这在GA里面默认就是一个新用户的,所以识别不到,但是,如果用户登录的话,那么就可以拿到之前的userid,而这个userid就是用户的唯一标示,所以可以识别到。 各类用户ID及其局限

在GA里面有两个ID很重要,一个是Clientid,一个userid。 clientid是GA默认生成的,跟设备和浏览器相关,主要用户切换设备或浏览器就会生成一个新的userid,所以,如果你现在用ie访问我的博客,一会用chrome访问的,那么在我的GA里面记录到的新用户是2个的,client的构成是有一段随机数和时间戳构成的,

而userid则可以自定义的,原理上,你可以直接使用用户的唯一标示作为userid,如邮箱,手机号,身份证等,这些都属于PII信息,谷歌是禁止传递这些的,所以,我们一般是用用户id的hash值作为Userid。

它们之间具有如下区别:

但userid也有些缺点的,比如用户在没有登录之前的是识别不了的,官方还有如下的限制: 由 User-ID 功能启用的跨设备报告的日期范围跨度不能超过 90 天。 无论是使用网页界面还是 API,都不能将 User-ID 值作为报告中的维度来进行查询。

原文发布于微信公众号 - GA小站(ichdata)

原文发表时间:2018-05-11

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏EAWorld

以服务网格实现微服务的高级Traffic-shadowing模式

作者:Christian Posta 译者:月满西楼 原题:Advanced Traffic-shadowing Patterns for Microser...

3183
来自专栏网站设计制作、数字营销

网站在百度搜索结果中被标识危险什么原因

在日常的百度搜索中,会有时发现在搜索结果中出现有的网站快照索引被百度标识为危险标识风险提示,发生这样的风险提示是什么原因?公司网站在百度搜索结果中出现这样的情况...

2120
来自专栏逍遥剑客的游戏开发

从Native到Web(五), emscripten学习笔记: 初体验

1533
来自专栏源哥的专栏

在线客服技术详解(未完待续)

<?xml:namespace prefix = v ns = "urn:schemas-microsoft-com:vml" /><?xml:namespac...

2604
来自专栏阮一峰的网络日志

软件架构入门

软件架构(software architecture)就是软件的基本结构。 合适的架构是软件成功的最重要因素之一。大型软件公司通常有专门的架构师职位(archi...

2914
来自专栏java、Spring、技术分享

从零开始学架构读书笔记

  软件架构的出现是为了解决系统规模增加后出现了系统耦合严重,开发效率低,逻辑复杂,扩展困难等问题。所以架构设计是为了解决软件复杂度而存在的,所以架构设计的目地...

4764
来自专栏即时通讯技术

高性能网络编程(二):上一个10年,著名的C10K并发连接问题1、前言 2、学习交流3、C10K问题系列文章4、C10K问题的提出者5、C10K问题的由来6、技术解读C10K问题7、C10K问题的本质

对于高性能即时通讯技术(或者说互联网编程)比较关注的开发者,对C10K问题(即单机1万个并发连接问题)应该都有所了解。“C10K”概念最早由Dan Kegel发...

1083
来自专栏Java技术栈

图解分布式架构的演进!

8495
来自专栏微信公众号:Java团长

剖析公司技术栈

来源:www.cnblogs.com/wangsen/p/9329735.html

1124
来自专栏原创

高并发大容量NoSQL解决方案探索

1598

扫码关注云+社区

领取腾讯云代金券