本文是斯坦福大学 CS229 机器学习课程的基础材料,原始文件下载[1]
原文作者:Arian Maleki , Tom Do 翻译:石振宇[2] 审核和修改制作:黄海广[3]
概率论复习和参考
概率论是对不确定性的研究。通过这门课,我们将依靠概率论中的概念来推导机器学习算法。这篇笔记试图涵盖适用于CS229的概率论基础。概率论的数学理论非常复杂,并且涉及到“分析”的一个分支:测度论。在这篇笔记中,我们提供了概率的一些基本处理方法,但是不会涉及到这些更复杂的细节。

举例:




通过使用这个函数,我们可以计算任意事件发生的概率。图 1 显示了一个样本CDF函数。

图1:一个累计分布函数(CDF)
性质:





举例:

举例:


一些随机变量的概率密度函数和累积分布函数的形状如图 2 所示。

图2:一些随机变量的概率密度函数(PDF)和累积分布函数(CDF)下表总结了这些分布的一些特性:

到目前为止,我们已经考虑了单个随机变量。然而,在许多情况下,在随机实验中,我们可能有不止一个感兴趣的量。例如,在一个我们掷硬币十次的实验中,我们可能既关心X(w)=出现的正面数量,也关心Y(w)=连续最长出现正面的长度。在本节中,我们考虑两个随机变量的设置。

性质:






引理 3.1


性质:



链式法则:


期望:


一本关于CS229所需概率水平的好教科书是谢尔顿·罗斯的《概率第一课》(A First Course on Probability by Sheldon Ross)。
[1]原始文件下载: http://cs229.stanford.edu/summer2019/cs229-prob.pdf
[2]石振宇: https://github.com/szy2120109
[3]黄海广: https://github.com/fengdu78