参考:
https://blog.csdn.net/weixin_44510615/article/details/103196607
补充概率论正态分布的知识:
设随机变量 具有概率密度
在这里插入图片描述
其中
为常数,则称
服从参数为
的正态分布,即
分布函数:
在这里插入图片描述
二、标准正态分布
密度函数
在这里插入图片描述
分布函数
在这里插入图片描述
三、性质、计算
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
置信区间是指由样本统计量所构造的总体参数的估计区间。在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。
最常出现的对置信区间的错误理解:
在95%置信区间内,有95%的概率包括真实参数 (错误!!)
是显著性水平(例:0.05或0.10)
指置信水平(例:95%或90%)
看下面题
在这里插入图片描述
第一步:求一个样本的均值 第二步:计算出标准差。 第三步:查表,根据
查t分布数据表,代入正态分布公式求解
在这里插入图片描述
在这里插入图片描述
了解t分布
t-分布(t-distribution)用于根据小样本来估计呈正态分布且方差未知的总体的均值。如果总体方差已知(例如在样本数量足够多时)
假设X服从标准正态分布N(0,1),Y服从
卡方分布,那么
的分布称为自由度为n的t分布,记为 Z~t(n)
概率密度函数
在这里插入图片描述
在这里插入图片描述
参数估计(parameter estimation),统计推断的一种。
根据从总体中抽取的随机样本来估计总体分布中未知参数的过程。
从估计形式看,区分为点估计与区间估计:从构造估计量的方法讲,有矩法估计、最小二乘估计、似然估计、贝叶斯估计等。
设总体 X 的分布函数形式已知, 但它的一个或多个参数为未知, 借助于总体 X 的一个样本来估计总体未知参数的值的问题称为点估计问题.
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
关于最大似然估计,有一个黑球和白球的栗子十分经典,初始来源已经很难考究。
设一个盒子里装有一定量的白球和黑球,试估计其中黑球比例 p 。假定进行 10 次有放回的抽取,抽到 3 个黑球。黑球个数
在这里插入图片描述
发生这一结果的概率
在这里插入图片描述
p=0.1时, P = 0.0574;p = 0.4 时, P = 0.215;p = 0.3时, P = 0.2668 。显然,取不同的p 得到的P有大有小,在我们已得到样本数据后,P为最大值时是最符合样本数据的。
极大似然估计方法的基本思想是以最大概率解释样本数据。
在数理统计学中,似然函数是一种关于统计模型中的参数的函数,表示模型参数中的似然性。
在这里插入图片描述 解法