📚 文档目录 随机事件及其概率 随机变量及其分布 期望和方差 大数定律与中心极限定理 数理统计的基本概念 参数估计 假设检验 多维 回归分析和方差分析 降维
P\{ 拒绝 H_0|H_0 为真\}=\alpha
P\{ 接受 H_0|H_0 为假 \}=\beta
(1) 建立于均值的备择假设和原假设,选定合适的显著性水平\alpha。
(2)建立检验统计量乙,满足Z \sim \mathrm{N}(0,1), 根据样本数据计算检验统计量数值Z。
(3)根据检验统计量数值 Z 和显著性水平\alpha,计算拒绝域。
(4)根据样本是否落入拒绝域作出判断, 有需要可以进一步输出 p 值(比样本观察更极端的概率)。
例题:
一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的行加工以期进一一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降机床进尺寸的平均误差与旧机床相比是否有显著降低?(a=0.01)尺寸的平均误差与旧机床相比是否有显著降低?(\alpha=0.01)
解:
建立假设: \quad H_{0}: \mu \geq 1.35, H_{1}: \mu<1.35
\bar{x}=1.3152, s=0.365749, n=50,计算检验统计量:
z=\frac{1.3152-1.35}{0.365749 / \sqrt{50}}=-2.6061<-z_{0.01}=-2.33
结论:拒绝 \mathrm{H}_{0^{\circ}} 新机床加工的零件尺寸的平均误差与旧机床相比有显著降低。计算p值
\text { p= } \Phi(-2.6061)=1-\Phi(2.6061)=0.004579<\alpha=0.01
根据p值和 我们可以得到同样的结论:拒绝H _{0} 。
PS: 这道题中样本总体方差是未知的, 本来应该用 t 检验, 但是在样本容量大于 30 的时候可以用 Z 检验代替 t 检验, 所以此处直接用样本方差代替了总体方差.
2.检验条件:两个总体不服从正态分布,但来自两总体的样本的容量较大 \left(n_{1}, n_{2} \geqslant 30\right)_{\circ} 则我们构造检验统计量Z如下: \quad Z=\frac{(\bar{X}-\bar{Y})-\delta}{\sqrt{S_{1}^{2} / n_{1}+S_{2}^{2} / n_{2}}} \sim \mathrm{N}(0,1)
t检验的基本步骤:
(1)建立关于均值的备择假设和原假设,选定合适的显著性水平\alpha。
(2)建立检验统计量t,满足t \sim \mathrm{t}\left(n^{\prime}\right), 根据样本数据计算检验统计量数值t。
(3) 根据检验统计量数值t和显著性水平\alpha,计算拒绝域。
(4) 根据样本是否落入拒绝域作出判断,如有需要可以进一步输出值。
公式参照参数估计
\chi^{2} 检验的基本步骤:
(1) 进立关于方差的备择假设和原假设, 选定合适的显著性水平 \alpha_{\circ}
(2) 建立检验统计量 \chi^{2}, 满足 \chi^{2} \sim \chi^{2}\left(n^{\prime}\right)^{1}, 根据样本数据计算检验统计量数值 \chi^{2} 。
(3) 根据检验统计量数值 \chi^{2} 和显著性水平 \alpha, 计算拒绝域。
(4) 根据样本是否落入拒绝域作出判断, 如有需要可以进一步输出 p 值。
\chi^{2}=\frac{(n-1) S^{2}}{\sigma_{0}^{2}} \sim \chi^{2}(n-1)
例题: 生产的某型号电池,其寿命服从方差 \sigma^2=5000 的正态分布.随机取26个电池,测出样本方差为 \mathrm{s}^{2}=9200, 问能否推断波动较以往显著变化 (\alpha=0.02) ?
原理与上面的类似, 公式参照参数估计
例: 某地 16 座预售楼盘均价如下表 ( 单位: 元/平方米 )
判断楼盘价格与媒体公布的 7900元/平方米是否相符(\alpha = 0.05)
若用 t 检验来做, 是无法拒绝原假设 H_0: \mu = 7900 的, 但是样本中只有 3 个大于 7900, 此时用平均值并不能很好地衡量总体, 因此考虑用中位数.
建立假设:
H_0:M_e = 7900, H_1: M_e\ne 7900
Mc 为总体中位数, n_{+} , n_- 分别为大于小于 7900 样本的个数. H_0 若为真, n_+ , n_-
近似相等, 即n_+ 不能太大也不能太小. 因此对 n_+ 进行检验:
n_{+}=\sum_{i=1}^{n} Y_{i}. 中 Y_{i} \sim B(1, p), n_{+} \sim B(n, p), p=P\{X_{i} \geq M_{e}\}, 做如下假设:
H_{0}: p=0.5, H_{1}: p \neq 0.5
抽到样本 n_{+} =3 甚至更为极端的概率为:
B(3 ; 16,0.5)=\sum_{i=0}^{3} C_{16}^{i}(0.5)^{i}(0.5)^{16-i}=0.0213
则 p 值就是 0.0213, 由\mathrm {p} = 0.0213<\alpha = 0.05
两个连续性总体的密度函数至多只差一个平移. 秩和检验可以用于判断两个样本是否来自同一总体.
各项假设:
\begin{aligned} H_0: \mu_1 = \mu_2,H_1: \mu_1<\mu_2\\ H_0: \mu_1 = \mu_2,H_1: \mu_1\neq\mu_2\\ H_0: \mu_1 = \mu_2,H_1: \mu_1>\mu_2\\ \end{aligned}
步骤( 以双边检验为例 ):
*若 n_1,n_2 \geq 10, 当 H_0 为真的时候, 近似地有:
R_1 \sim N(\mu_{R_1},\sigma^2_{R_1}).
可以采用 Z 检验.
判断一组样本是否服从某种分布, 可进行卡方拟合优度检验, 首先 当然需要设置H_0,H_1.
\chi^2 = \sum^k_{i=1}\frac{(O_i-T_i)^2}{T_i} \sim \chi^2{(n-1)}
其中, 将样本分为 k 个组, T_i是每组的理论频数, T_i=nP_i, P_i 是每组的理论频率, O_i 是每组观测的频数
如果理论分布有 r 个位置参数用估计量代替, 则n-> \infty, \chi^2\sim \chi^2(k-r-1)