前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >网站及APP坑位流量归因分析-(2)数据采集篇

网站及APP坑位流量归因分析-(2)数据采集篇

作者头像
万能数据的小草
发布2022-09-21 09:34:02
1.2K0
发布2022-09-21 09:34:02
举报
文章被收录于专栏:万能的小草

前一节讲到多种流量归因的模型,本质上流量归因是为了辅助我们如何将钱花的更有价值以及高效洞察用户的习惯和行为,为下一步迭代产品的功能提供数据支撑。今天这一节,结合具体的业务场景来看看流量归因分析如何在数据采集方案上落地的。

业内通用五大基本归因方案 旺盛的小草,公众号:万能的小草网站及APP坑位流量归因分析-(1)理论篇

一、背景

比如B站的产品内,提供了非常多的入口能够使得用户进入直播间里面。(如:首页推荐、搜索入口、关注入口、历史记录、我的收藏 etc),房间的效果是否符合预期,他们给整个平台以及娱乐分区分别共享了多少流量,以及带来了多少付费用户,这些都是产品和运营同学日常工作中比较关心的内容。

经常会有这些问题围绕着运营:

  • 为什么这个UP主的流量波动这么大?
  • 近期上线了一个资源运营位,它给平台带来多大的收益?
  • 分区流量突然“暴涨”的原因是什么导致的?

二、目标

其实上述问题,占用了数据分析同学大量的时间去排查。由于涉及到主端APP的快速迭代,单次的分析很难实现复用,因此在这种背景下急需提供标准化的流量归因产品去快速实现流量来源拆解,快速定位KPI异动原因,满足业务运营的日常监控诉求。

类别

时间维度

用户类型

解决的问题

流量入口

日、周、月、季度、年

整体、新增、留存、回流

有多少用户来过此入口观看时长、弹幕量、投币量、次日留存率流量入口交叉对比分析

  • 有多少用户来过此入口
  • 观看时长、弹幕量、投币量、次日留存率
  • 流量入口交叉对比分析

三、准备工作

为了实现流量的快速归因,需要依赖于我们有完善的数据采集。过程中需要解决的问题:

  • 用什么来界定用户行为路径的最小单元?
  • 怎么确定用户的落地页与离开页面?

业内常用的是session_id

Session_id:将用户(设备ID)访问一次APP内的所有路径记做行为路径的最小单元,而访问的定义是由埋点数据采集的session_id来界定的
Web端:
  • 用户打开网站,并在浏览器内持续与网站交互,直至退出APP;
  • 用户在网站内无任何操作行为时间超过30分钟时,会话ID更新;
移动端:
  • 用户启动app后,并保持APP前台展示,退出APP后台超过30S 或 完全退出APP记为一次访问
  • 用户退出APP内后台,<= 30s 内回到app,会话ID 保持不变,超过30S,由后台状态打开APP,会话ID更新

行为路径分类

页面访问路径:根据用户在网站内的页面跳转情况,来进行路径分析

模块路径(点击路径):根据用户在网站内的功能点击流转,如从模块A跳转到模块B,来进行用户行为路径分析。过程中需要考虑的点:
  1. 如何界定一次有效页面跳转?剔除无效数据
    • 在真实用户行为路径中,一定会有相当一部分页面跳转路径是对于分析无效的,比如用户由于操作习惯,会在在同级的tab中不断切换,如首页推荐分类列表页的tab之间,那就需要相应的计算方案去剔除这类数据
  2. 客户端:由于Web、PC客户端存在页面多开窗口的场景,而移动端APP相对而言,用户路径相对明确,所以优先选择从移动端行为路径着手
计算方案
  • 整体的计算方案可以归结为:【分类】+【去重】
  1. 页面分类:将页面按照业务分类,一二三四级,如APP启动的主页面的五个Tab,为第一层,列表页为第二层。依次类推。

2. 计算路径去重:统计页面跳转记为有效路径,不同层级跳转记为无效路径,剔除异常数据。

数据采集需要的信息如下:

字段顺序

字段名称

字段类型

字段注释

1

bili_code

STRING

埋点点位编码

2

app_key

STRING

APP编码

3

app_name

STRING

APP名称

4

page_code

STRING

页面编码

5

page_name

STRING

页面名称

6

dateline

BIGINT

时间戳

7

uuid

STRING

用户唯一编码

8

user_id

BIGINT

用户user_id

9

up_id

BIGINT

UP主ID

10

ip

STRING

用户IP

11

occur_time

BIGINT

APP埋点触发时间,毫秒时间戳

12

session_id

BIGINT

会话ID

13

version

STRING

APP版本号

14

event_id

BIGINT

事件ID

15

business_id

BIGINT

埋点时所在业务编码

16

ext_up_id

BIGINT

ext中UP主user_id

17

up_id_com

BIGINT

用户跳转UP主号

18

pos

BIGINT

推荐运营位

19

business_name

STRING

业务名称

20

page_combine

STRING

统一页面名称

21

r_business_id

BIGINT

UP主对应业务ID

22

r_business_name

STRING

UP主对应业务名称

本期介绍如何去做归因分析的数据采集,下一篇文章会实战介绍如何将采集的信息进行算法分析统计。

🧐欢迎大家分享、点赞、在看,给个3连击呗!👇

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-04-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 万能数据的小草 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Session_id:将用户(设备ID)访问一次APP内的所有路径记做行为路径的最小单元,而访问的定义是由埋点数据采集的session_id来界定的
    • Web端:
      • 移动端:
      • 行为路径分类
      • 页面访问路径:根据用户在网站内的页面跳转情况,来进行路径分析
        • 模块路径(点击路径):根据用户在网站内的功能点击流转,如从模块A跳转到模块B,来进行用户行为路径分析。过程中需要考虑的点:
          • 计算方案
          相关产品与服务
          云直播
          云直播(Cloud Streaming Services,CSS)为您提供极速、稳定、专业的云端直播处理服务,根据业务的不同直播场景需求,云直播提供了标准直播、快直播、云导播台三种服务,分别针对大规模实时观看、超低延时直播、便捷云端导播的场景,配合腾讯云视立方·直播 SDK,为您提供一站式的音视频直播解决方案。
          领券
          问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档