一、算法原理
1. 什么是波动归因?
目前的波动归因功能是针对维度字段的下钻归因,维度归因指通过分析业务指标在不同维度(如用户地域、设备类型、广告主等)上的分布变化,定位指标波动根本原因的算法。例如,当广告收入突然下降时,维度归因能快速识别是某个地区的用户活跃度降低,还是某个广告位的配置错误导致。
核心目标 :
将复杂的指标波动(如收入、点击率变化)拆解到具体维度,帮助业务人员快速定位问题根源,支持数据驱动的决策。
2. 算法核心机制
解释力(Explanatory Power)
定义 :衡量某一维度对指标波动的贡献程度。
公式 :EPij= (实际值i - 预测值i) / (整体实际值 - 整体预测值)
例如,若某广告主的收入下降占整体下降的50%,则其解释力为50%。
作用 :筛选出对波动影响最大的维度元素(如某个浏览器版本、广告主)。
简洁性(Succinctness)
定义 :用最少的维度元素解释最大的波动。
实现 :优先选择解释力高且元素数量少的维度组合。
例如,若“浏览器类型=Chrome”能解释80%的收入下降,则无需列举其他次要因素。
惊喜度(Surprise)
定义 :衡量维度分布变化的异常程度,通过JS散度 (Jensen-Shannon Divergence)计算。
公式 :Sij=0.5[plog(2p/(q + p)) + qlog(2q/(q + p))]
(p):预测分布(如某浏览器历史收入占比30%),
(q):实际分布(如该浏览器当日收入占比5%)。
作用 :排除正常波动,聚焦分布显著变化的维度(如某浏览器突然无收入)。
3. 算法实践案例:
数据输入 :
预测值与实际值(如每小时广告收入、点击量)。
多维度数据(广告主、设备类型、地域等)。
根因筛选流程 :
步骤1 :计算每个维度元素的解释力,筛选出贡献超过阈值的元素。
步骤2 :按简洁性原则,组合最少元素解释最大波动。
步骤3 :通过惊喜度排序,优先输出分布变化最异常的维度(如某设备类型收入占比从50%骤降至0%)。
衍生指标处理 (支持中):
对于点击率(CTR)、每点击成本(CPC)等衍生指标,采用偏导数法计算元素贡献4。
例如,若某广告主的点击量增加但收入下降,可能因其低价值广告占比较高,算法会识别其对CPC下降的贡献。
二、权限配置
数据解读作为腾讯云 ChatBI 的智能工具,支持配置此功能的配置。
配置维度:项目维度生效
拥有配置权限的角色:企业管理员、本项目管理员(其他角色不可见配置按钮)
配置路径:ChatBI > 配置 > 智能工具 > 波动归因
配置按钮如下:

单击波动归因按钮进行配置

开启波动归因:默认开启,开启后,问题和结果的明细数据将提供给模型波动归因,通过维度归因的方法分析不同维度对波动的贡献,并给出波动归因的。如果因为数据敏感不想传递给模型,请关闭此功能。
内容默认展开:默认关闭,开启后,波动归因的分析结果将无需点击自动生成并展开。
维度智能选择:默认关闭,数据表维度过多会降低分析速度,开启此选项模型会智能选择分析维度提升分析速度,但模型选择可能会导致重要维度被忽略。
三、功能使用
1. 触发逻辑
单一聚合指标:目前仅支持单一的聚合指标,例如收入情况。支持sum数值/count字符/distinct(count)字符。
明确的时间条件:例如2024年,不支持所有时间。
基期数据:波动归因的前提是需要计算波动数据,因此必须有基期时间的数据。例如:请计算2024年的收入情况?现期是2024年,那么必须有基期2023年的数据。
2. 展示说明

(1)波动分析
2023年Q1与2024年Q1乳制品销售额的波动变化情况和同比率变化
绿色代表减少,红色代表增长。
(2)归因分析
模型将根据2023年1月与2024年1月用户消费金额的波动情况进行归因分析,并按照影响程度从大到小进行维度排序。
说明:
计算方法为分布差异法,即维度相对波动变化的偏移程度,偏移程度越大对波动的影响越大,排名并非是同比增长情况。
维度下钻:根据模型提供的影响度前三的维度,进行维度下钻,计算维度值的同比增长和同比率。
(3)总结和建议
根据用户问题和工具分析结果,从通用知识库中召回相关知识,包括行业知识、节假日信息等。当前支持分析波动归因的前5个top维度。
(4)时间对比周期自定义
支持自定义调整对比的时间周期,波动归因支持按照数据表本身的时间颗粒度做自定义时间对比。
满足客户的非标准时间周期对比需求,例如对比不同年份的春节、对比618大促前后,时间周期随客户自由选择;
(5)维度自定义
支持调整波动归因的分析的维度结果,支持删除和恢复。
删除

恢复
