A /B测试:即对照实验,就是有多个方案时,想要看哪个方案的效果更好,会根据一些结果参数决定最终采用哪个最优的方案。
在医药,农业,制造业和广告等等行业起到重要作用。
通过设计科学实验、样本分析、小流量测试等方式获得具有代表性的结论,并确信该结论可以推广到全局。
一般流程:数据收集-明确目标-提出假设-构建调整-测试运行-分析结果
例如:总统竞选页面如何选照片可以提高投票率呀?
有四种方案,将用户分成四份,测试各自效果,选择最优的作为最终页面上显示的照片。同理可以推广到其他元素。
如下图: 假设本来是 True,但是根据经验判断成 False,就是 Type 1 Error 。 假设本来是 False,但是根据经验判断成 True,就是 Type 2 Error 。
[图来自这儿](https://www.zhihu.com/question/37437658)
看到了个印象最强烈的例子,引来增强一下冲击感:
这就好比谈恋爱。比方说: H0:一个真心爱你的男生 H1:一个不是真心爱你的男生
如果H0实际上成立,而你凭经验拒绝了H0,也就是说,你拒绝了一个你认为不爱你而实际上真心爱你的男生,那么你就犯了第Ⅰ类错误;
如果H0实际上不成立,而你接受了H0,同样的道理,你接受了一个你感觉爱你而实际上并不爱你的男生,那么你就犯了第Ⅱ类错误。