前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >AB实验中不同类型指标使用的假设检验方法

AB实验中不同类型指标使用的假设检验方法

作者头像
曲奇
发布2022-05-30 09:32:32
4.7K0
发布2022-05-30 09:32:32
举报
文章被收录于专栏:曲奇的博客曲奇的博客

衡量业务表现有很多的指标,比如均值类指标、比例类指标等。不同的指标类型,服从不同的概率分布,我们需要通过一个合理的检验方法,了解指标本身的离散程度,才能知道当指标发生变化的时候,是不是说明实验是显著的还是自然的波动。所以在进行AB实验的过程中,需要使用不同的假设检验方法。

均值类指标

最常见的均值类(Mean)指标,比如用户的人均时长、平均购买金额等。中心极限定理是均值类指标的特性,当样本容量足够大时,均值类指标会趋近于正态分布。但是,有个问题是我们做实验只能抽样做实验,没有办法在总体上进行实验。所以总体的方差对我们是不可知的,在进行均值类指标的假设检验时,会选用T检验。 T检验的来源也即是根据小样本来估计总体均值。最普通的单样本t检验就是通过样本均值来检验总体均值是否大于某个值。

 t=\frac{\bar{X}-\mu}{S / \sqrt{n}}
t=\frac{\bar{X}-\mu}{S / \sqrt{n}}

而在AB实验中,实验组和对照组的比较,会使用两总体均值的T检验来检验实验组的变化是否显著。

  t=\frac{\bar{x_T}-\bar{x_C}-0}{\sqrt{\frac{S^2_T}{n_T}+\frac{S^2_C}{n_C}}}
t=\frac{\bar{x_T}-\bar{x_C}-0}{\sqrt{\frac{S^2_T}{n_T}+\frac{S^2_C}{n_C}}}

用户比例类指标

比例类(Proportion)指标比如UV转化率、次日留存率等,一般是“某条件下用户去重计数 / 用户去重计数”,使用的是两总体比例的T检验。比如对于单个用户的留存行为,结果只有两种:要么发生,要么不发生。n次试验中成功次数的概率满足二项分布。

当样本容量n很大时候,样本比率的抽样分布近似服从正态分布,因此我们可以使用Z检验来检验两个总体比例相等的假设是否成立。

设两个总体服从二项分布,这两个总体中具有某种特征单位数的比例分别为

\pi_1
\pi_1

\pi_2
\pi_2

,但总体的比例未知,我们可以知道样本比例为

p_1
p_1

p_2
p_2

原假设的表达式为

H_0: \pi_1-\pi_2=0
H_0: \pi_1-\pi_2=0

。在原假设成立的条件下,方差是

p(1-p)
p(1-p)

,其中

p
p

是合并两个样本的比例估计量:

p=\frac{x_1+x_2}{n_1+n_2}=\frac{p_1n_1+p_2n_2}{n_1+n_2}
p=\frac{x_1+x_2}{n_1+n_2}=\frac{p_1n_1+p_2n_2}{n_1+n_2}

x_1
x_1

表示样本

n_1
n_1

中具有某种特征的单位数,

x_2
x_2

表示样本

n_2
n_2

中具有某种特征的单位数。

最后给出统计量

 z=\frac{{p_1} - {p_2} - 0}{\sqrt{({p}(1-{p})(\frac{1}{n_1}+\frac{1}{n_2})}}
z=\frac{{p_1} - {p_2} - 0}{\sqrt{({p}(1-{p})(\frac{1}{n_1}+\frac{1}{n_2})}}

样本量类指标

样本量类(Count)指标,比如DAU、点击UV等。对于此类样本量类的指标,因为不适用于中心极限定理,我们也不能近似它为某一种分布类型,就会使用非参数假设检验(不要求总体的分布以特定参数为特征的假设检验)来进行检验,如卡方检验。

chi-square的计算公式如下,其中O代表观测值(observed value), 代表期望值(expected)。n代表实验方案数量。

 \chi^{2}=\sum_{i=1}^{n} \frac{\left(O_{i}-E_{i}\right)^{2}}{E_{i}}
\chi^{2}=\sum_{i=1}^{n} \frac{\left(O_{i}-E_{i}\right)^{2}}{E_{i}}

卡方检验常用于验证两个变量抽出的配对观察组是否相互独立。在我们的场景中,假如我们要观察实验组和对照组,点击UV是否有差别。即检验两个变量(变量1是不同组,变量2是点击UV)是否独立。零假设是:没有差别,点击UV和不同组没有关系。

我们计算出

\chi^{2}
\chi^{2}

和自由度,就能计算卡方分布的P值,根据P值的大小判断是否显著,如果不显著则无法拒绝原假设。

参考: 1. https://www.zhihu.com/question/54444591 2. wiki百科-卡方检定 3. https://www.jianshu.com/p/9ff6f9c4fb14

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-05-29,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 均值类指标
  • 用户比例类指标
  • 样本量类指标
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档