多维用户行为模型核心思想是在数据仓库的DWD和DWS层回答 "用户(User) 在什么时间(When),什么地点(Where), 通过何种方式(How), 对谁(Who,可能是feed,也可能是user), 做了什么(What或者Event)",一般是基于ODS层的用户维度表,用户行为日志明细表数据,在DWD加工而成,然后直接服务上层应用(建视图的方式)或者根据需求配合产品维度表在DWS汇总面向业务应用。常见的是用户行为分析的漏斗转化,桑吉图显示, 用户统计标签加工等。
User: 即用户行为的主体,可能是发布视频的唯一用户id, 也可能是观看视频未登录的设备id。
字段 | 描述 | 是否可选 |
---|---|---|
user_id | ||
sex | ||
name | 名称 | 是 |
user_category | 用户分类 |
When: 用户行为发生的实际时间
字段 | 描述 |
---|---|
client_time |
Where: 用户行为发生地点,可能是IP 地址,也可能是GPS地理信息解析等内容。
字段 | 描述 |
---|---|
client_ip |
How: 用户行为的方式方法,这个概念比较广,包括用户使用的设备信息,操作系统信息,渠道,APP信息,是使用Wifi还是移动网络4G等。
字段 | 描述 |
---|---|
brand | 设备品牌 |
model | 设备型号 |
channel | 渠道 |
deviceid | 设备id |
os_version | 操作系统版本 |
client_version | |
net_type | 3g/4g/wifi |
Who: 用户行为对象,通常是video_id, 对于内容频道,分类等信息。如果用户行为是对另外一个用户,则为user_id。
字段 | 描述 | 是否可选 |
---|---|---|
target_id | 用户行为对象id | |
Event: 用户行为实体,包括用户行为ID,用户行为内容。 如发布,发布视频信息,搜索,搜索内容或者转发,转发到朋友圈,或者关注,关注用户id。
字段 | 描述 | 是否可选 |
---|---|---|
event_id | 用户行为id | |
event_name | 用户行为名称 | 是 |
event_content | 用户行为内容 | 是 |
因为在这张表是最细粒度的数据,字段是高频字段,基于这种思想做DWS层宽表设计,方便基于用户行为做数据分析,数据挖掘和对于用户画像,用户推荐等业务应用场景。
也可能出现为了配合业务需求,可能需要和用户维度表,内容维度表做关联查询。当然也可以在该宽表后续使用过程中因为高频字段不够,进行新增,这时则变更对应的DDL,同时保留历史DDL。
DWS层表宽表设计开发
类型 | 字段 | 描述 | 来源 | 作用 |
---|---|---|---|---|
User | user_id | 用户id | ||
User | gaid | 用户广告id | 1.维度2.统计DNU,DAU等指标 | |
user_status | ||||
sex | 性别 | 维度 | ||
user_category | 用户类别 | user_category_info | 维度 | |
How | deviceid | 设备id | vskit_server_log | 维度,也可以替代用户id,监测是不是异常设备和异常账号 |
imei | ||||
brand | 设备品牌 | vskit_server_log | 1.维度2.统计品牌数量 | |
model | 设备型号 | vskit_server_log | ||
os_version | 操作系统版本 | vskit_server_log | ||
client_version | APP版本 | vskit_server_log | 维度 | |
net_type | 网络类型 | vskit_server_log | 维度 | |
channel | 渠道 | vskit_server_log | 1.维度2.统计渠道数量 | |
android_id | vskit_server_log | |||
system_language | vskit_server_log | |||
When | client_time | vskit_server_log | 时间维度 | |
Where | client_ip | vskit_server_log | 维度,基于该字段解析地址信息 | |
Event | event_id | 用户行为id | 1. 维度2. 如评论,则统计评论数量,点赞则统计点赞数量等3. 素材使用,如音乐,贴纸等,该id使用自定义event_id _视频id的方式 | |
item_type | ||||
item_id | ||||
pre_page_id | ||||
page_id | 用户行为发生页面 | 1. 维度2.页面统计 | ||
seesion_id | 用户行为发生的会话 | 维度 | ||
event_content | 用户行为内容 | |||
Who | target_id | 1.维度2.对video_id统计VV等指标3.对user_id统计关注人数等4. 素材id | ||
target_info | user_category_info或者video_tags_info等相关信息 | |||
dt | 时间分区 | dt=yyyyMMdd | ||
target | 用户行为目标分区 | target=videotarget=user | ||
isNewUser | 是否新用户分区 | 待定 | ||
说明:
类型:User/When/Where/How/Who/Event
字段:表的字段名称
描述:表的字段描述
来源:字段来源于那张表的字段
作用:是查询维度还是指标,指标加工方式
目前维度字段添加较少,主要是Who, How的维度,需要熟悉的人进行多添加。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。