需求简介
计算页面单跳转化率,什么是页面单跳转换率,比如一个用户在一次 Session 过程中访问的页面路径 3,5,7,9,10,21,那么页面 3 跳到页面 5 叫一次单跳,7-9 也叫一次单跳...在该模块中,需要根据查询对象中设置的 Session 过滤条件,先将对应得 Session 过滤出来,然后根据查询对象中设置的页面路径,计算页面单跳转化率,比如查询的页面路径为:3、5、7、8,那么就要计算...思路分析
读取到规定的页面
过滤出来规定页面的日志记录, 并统计出来每个页面的访问次数 countByKey 是行动算子 reduceByKey 是转换算子
明确哪些页面需要计算跳转次数 1-2, 2-...3, 3-4 …
按照 session 统计所有页面的跳转次数, 并且需要按照时间升序来排序
按照 session 分组, 然后并对每组内的 UserVisitAction 进行排序
转换访问流水
过滤出来和统计目标一致的跳转...过滤出来目标跳转流,然后再聚合
分母
页数1的点击数
*/
2.