Beta分布在统计学中是定义在[0,1]区间内的一种连续概率分布,有α和β两个参数。
其概率密度函数为:
wiki_PDF
累计密度函数为:
wiki_CDF
就PDF的公式而言,Beta分布于二项分布还是比较相似的:
(图片来自于https://towardsdatascience.com/beta-distribution-intuition-examples-and-derivation-cf00f4db57af)
对于二项分布而言,概率是个确定的参数,比如抛一枚质地均匀的硬币,成功概率是0.5;而对于Beta分布而言,概率是个变量。
假如我们投掷三枚硬币,都是正面,可以得到正面的概率是100%, 但是其实并不一定是这枚硬币有问题,而是试验次数太少。如果我们每次都随机投一定数量的硬币,最后看这些概率的分布情况,判断这个硬币是否质地不均。不过Beta分布的主要用途在于,当我们有先验信息时,再考虑实际情况,可能会对之后成功概率的预测更加准确。之后将会更详细的讲一下共轭先验和Beta分布的例子。