广义XX分布概述

对于常见的分布,大家对一些指数簇分布(Exponential Family Distribution)都很熟悉,譬如正太分布,二项式分布,当然不是所有的分布都是指数簇分布,譬如t-student分布,和均匀分布。另外有一些分布比较有意思,号称自己是广义分布(Generalized),并且部分广义分布是统计学最新进展的成果。

广义正态分布(generalized Normal distribution, GND): 是对对称的,关注均值和尾部分布变化的一类的分布。有三个典型参数,均值(alpha),缩放(scale),和外形(shape)。这个函数统一了典型的Laplace分布和Normal分布。

广义线性模型分布(Generalized Linear Model Distribution, GLMD): 指数簇分布,偶尔也被称为广义线性模型分布,因为指数簇函数,可以看成有限制条件的最大熵模型(Maximum Entropy)分布,而这个限制条件就是自然参数(Natural Parameter)或者标准参数(Canonical Parameter)的由来。而GLM就是将这个参数做替换而得到链接函数(LinkFunction)。它包括三个参数,自然参数(natural parameter), 充分统计量(Sufficient statistic),还有一个是归一化常数(normalized) 又被称为log-partitionfunction,这个参数在前面两个参数确定的时候就自动确定了。

1. 自然参数可以理解为对分布位置的一个限制曲线。

2. 充分统计量:就是希望用一个变量将样本中所有未知参数的信息全部集中起来。 换句话理解就是, 除了自然参数外的所有未知性由这个参数来决定, 所以它要独立于自然参数。这种好玩的概念也是Fisher首先提出来的。

广义极值分布(Generalized Extreme Value Distribution, GEVD): 这是对极值,稀奇事建模一类分布。我们知道在正态分布中, 小概率事件一般是指偏离3倍标准差之外的事件,而这又被称为尾风险(Tail Risk)。 和GGD类似, 它也有三个参数:位置,缩放, 和外形。 这个广义统一了Weibull,Gumbel(log-Weibull), 和Frechet(inverse-Weibull)三个分布。

Weibull: 存活率的一种建模

Gumbel 和Frechet:都可以作为一年中日降雨量的最大值。

广义帕雷托分布(Generalized Pareto Distribution, GPD): 和GEVD分成类似,也是一类尾风险的建模。 这类分布最早是用来描述财富在人口中的分布。 一个常见情形是, 大量财富集中在少数人那里。 或者说80-20 原则就是这么来的。它们也是有三个参数来决定的:位置,缩放, 和外形

广义逻辑分布(Generalized Logistic Distribution, GLD):这是对一些指数分布的对数形式的一个泛化。所以它包含很大一类分布的。常常模拟各种存活率。

广义伽玛分布(Generalized Gamma Distribution, GGD): 一般用来拟合生存数据,伽玛分布可以看成是泊松分布的一个推广,假如你每天有一个死去的概率,那么你最后能活多久的概率就可以用伽玛分布来拟合, 而GGD就是把Gamma分布,Weibull分布,和Exponential分布的一个统一。指数分布(Exponential Distribution)和几何分布(Geometric Distribution)是唯一的连续和离散的无记忆分布(Memoryless)。

综上,我们可以看到上面这些分布都是按一类需求,按照已有的分布重新进行扩展。因此他们形成了你中有我,我中有你的广义XX分布。

参考:

https://en.wikipedia.org/wiki/List_of_probability_distributions

https://en.wikipedia.org/wiki/List_of_probability_distributions

https://en.wikipedia.org/wiki/Exponential_family

https://en.wikipedia.org/wiki/Generalized_log-series_distribution

https://en.wikipedia.org/wiki/Generalized_gamma_distribution

https://en.wikipedia.org/wiki/Generalized_Pareto_distribution

https://en.wikipedia.org/wiki/Generalized_logistic_distribution

https://en.wikipedia.org/wiki/Generalized_normal_distribution

https://en.wikipedia.org/wiki/Generalized_extreme_value_distribution

https://en.wikipedia.org/wiki/Generalized_multivariate_log-gamma_distribution

https://en.wikipedia.org/wiki/Generalized_logistic_distribution

https://en.wikipedia.org/wiki/Generalized_Dirichlet_distribution

https://en.wikipedia.org/wiki/Generalised_hyperbolic_distribution

https://en.wikipedia.org/wiki/Generalized_linear_model

http://www.vosesoftware.com/vosesoftware/tmp/ModelRiskHelp/Distributions/Continuous_distributions/Generalised_logistic_distribution.htm?rhtocid=8.2.1.0_46

本文分享自微信公众号 - AI2ML人工智能to机器学习(mloptimization),作者:史春奇, 王雅清

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2016-10-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 非均衡数据处理--如何评价?

    在分类问题中, 常见的数据预处理包括: 数据缺失(Missing), 奇值处理(Outlier), 数据变换(Transformation), 特征选择(Fea...

    史博
  • 给能量以自由吧!

    在“随机眼里的临界”里面我们介绍了先驱 玻尔兹曼Boltzmann 受到Maxwell的影响, 同时被影响的还有另外一位大神叫 吉布斯 Gibbs, 这是今天的...

    史博
  • 伯克利视角:AI系统的九大挑战

    我们在“人工智能深度学习人物关系[全]”和“深度学习名校课程大全”反复提到伯克利大学在机器学习中的地位! 这不, 20天前, 伯克利大学总结了当前人工智能的挑战...

    史博
  • Octopress中处理加网分享问题

    作为一个以内容为中心的网站,在文章结尾增加社会化分享按钮是一种标配,使用Octopress也不例外,本博客选用了加网的社会化分享按钮。开始的时候一切顺利,但是后...

    技术小黑屋
  • 【读书笔记】之概率统计知识梳理

    用户1594945
  • HDU 1022(关于栈的详细解法)

    思路:那么我们用栈来解决这个问题,无非是入栈,出栈。那么我们先压入出栈序列的第一个元素,然后我们就需要要进行判断了。如果栈中元素等于预想出栈序列的头元素,那么就...

    用户7727433
  • 网络安全的概念的发展过程

    网络安全是一门涉及计算机科学、网络技术、通信技术、密码技术、信息安全技术、应用数学、数论、信息论等多种学科的综合性学科。

    周俊辉
  • 你必须知道的Dockerfile

    本篇已加入《.NET Core on K8S学习实践系列文章索引》,可以点击查看更多容器化技术相关系列文章。

    Edison Zhou
  • Validating Form Input With Spring Boot

    这个例子用于演示在Spring Boot应用中如何验证Web 应用的输入,我们将会建立一个简单的Spring MVC应用,来读取用户输入并使用validatio...

    阿杜
  • 要一遍做对——LeetCode题目20:有效的括号

    给定一个只包括 '(',')','{','}','[',']' 的字符串,判断字符串是否有效。

    二环宇少

扫码关注云+社区

领取腾讯云代金券