学过统计学基础的同学们,对P值耳熟能详,脱口而出;关于功效我们多半像个丈二和尚,摸不着头脑。
1,两种错误的世界
我们做任何决策是在两种错误中去做选择:忽略细节,放弃真的错误(大事败于细节);困于纷乱,而不能断的,保留伪的错误(当断不断必受其乱);当样本例数固定的情况下,两种错误此消彼长,难舍难分,也许这是人生的“鱼与熊掌”。
2,P值与功效
P值:拒绝原假设而犯错第一类错误的概率。是在【基准显著水平】做拒绝或不拒绝原假设的定性指标。
功效是:1-β(第二类错误的概率)概率来定义,它衡量真实事件发生的概率。
为什么有了P值检测,还有功效检测呢?实验最重要的是提升可信度和说服力,P值虽好但也不是处处皆好,所以多一个功效检测,多一道安心的保障。
4,主角的效应值的开场
影响功效的因素有3个:样本大小,显著性水平,效应值。
这里我们说一说:效应值,是度量处理(变量)差异的程度,可以简单理解两组或多组样本之间的差异程度,实验检测的主要是差异,也就是我们经常听到的方差。当处理之间的本身的差异越明显,我们检测需要的样本就越少;就如我们只用拿一头牛,一头马,就可以百分百断定二者存在显著差异一样。
4.1,效应值越多,我们需要的样本越少
我们用R中的包,可以作如下测试:在功效确定为:0.8,显著水平为:0.05时,可以看出样本与效应值是负相关的。
library(pwr);
pwr.t.test(d=0.8,sig.level = 0.05,power = 0.8,type = "two.sample")
4.2,效应值怎么计算呢?
我们也说过效应值是度量处理的差异程度的,不能的研究方向,不同的功效计算方法对应不同的效应值计算公式。常用的公式如下
4.3,效应值大小的标准?
不同分析场景,我们对功效大小的划分是不一样的,业内也有对应的基准值来作为判断的依据,对于特殊的研究领域可能并不适用。
如果效应值超大,我们还有功效分析的必要吗?
5,总结
功效的分析围绕着:样本量,置信水平,效应值;其中的效应值是重点,全文也作了很多描述。
R中也为我们提供可丰富的包,可以借助计算机来完成各种复杂的计算。
我们可以用样本量,置信水平,效应值来确定【功效】的大小。
同样也可以用功效,置信水平,效应值 来确定我们需要的最少【样本量】。