我最近读过关于概率分布的文章,发现正态分布是非常重要的。有几篇文章指出,建议数据服从正态分布。为什么是这样?如果我的数据服从正态分布而不是其他任何分布,我有什么优势。
发布于 2021-02-05 07:18:26
这是一个有趣的问题。很抱歉给你一个长篇大论的回答tl:dr;它是一些实际适用性、理论基础、历史包袱(由于计算能力有限)和对可分析、可操作的模型(而不是模拟/计算模型)的痴迷的混合体。在实际问题中使用它时,我们应该非常小心和有洞察力。
正态分布的重要性来自以下事实/观察:
总之,正态分布可以被认为是一个很好的基本情况,它在分析上易于处理,易于编码,似乎也适用于许多自然模型。在物理学中,我们考虑线性二阶微分方程来研究许多系统。现在并不是所有的系统实际上都是线性二阶的,但在一些约束条件下,这是一个合理的近似,便于分析和编码。
而过度使用正态分布实际上是有争议的。
https://datascience.stackexchange.com/questions/88957
复制相似问题