广义XX分布概述

对于常见的分布,大家对一些指数簇分布(Exponential Family Distribution)都很熟悉,譬如正太分布,二项式分布,当然不是所有的分布都是指数簇分布,譬如t-student分布,和均匀分布。另外有一些分布比较有意思,号称自己是广义分布(Generalized),并且部分广义分布是统计学最新进展的成果。

广义正态分布(generalized Normal distribution, GND): 是对对称的,关注均值和尾部分布变化的一类的分布。有三个典型参数,均值(alpha),缩放(scale),和外形(shape)。这个函数统一了典型的Laplace分布和Normal分布。

广义线性模型分布(Generalized Linear Model Distribution, GLMD): 指数簇分布,偶尔也被称为广义线性模型分布,因为指数簇函数,可以看成有限制条件的最大熵模型(Maximum Entropy)分布,而这个限制条件就是自然参数(Natural Parameter)或者标准参数(Canonical Parameter)的由来。而GLM就是将这个参数做替换而得到链接函数(LinkFunction)。它包括三个参数,自然参数(natural parameter), 充分统计量(Sufficient statistic),还有一个是归一化常数(normalized) 又被称为log-partitionfunction,这个参数在前面两个参数确定的时候就自动确定了。

1. 自然参数可以理解为对分布位置的一个限制曲线。

2. 充分统计量:就是希望用一个变量将样本中所有未知参数的信息全部集中起来。 换句话理解就是, 除了自然参数外的所有未知性由这个参数来决定, 所以它要独立于自然参数。这种好玩的概念也是Fisher首先提出来的。

广义极值分布(Generalized Extreme Value Distribution, GEVD): 这是对极值,稀奇事建模一类分布。我们知道在正态分布中, 小概率事件一般是指偏离3倍标准差之外的事件,而这又被称为尾风险(Tail Risk)。 和GGD类似, 它也有三个参数:位置,缩放, 和外形。 这个广义统一了Weibull,Gumbel(log-Weibull), 和Frechet(inverse-Weibull)三个分布。

Weibull: 存活率的一种建模

Gumbel 和Frechet:都可以作为一年中日降雨量的最大值。

广义帕雷托分布(Generalized Pareto Distribution, GPD): 和GEVD分成类似,也是一类尾风险的建模。 这类分布最早是用来描述财富在人口中的分布。 一个常见情形是, 大量财富集中在少数人那里。 或者说80-20 原则就是这么来的。它们也是有三个参数来决定的:位置,缩放, 和外形

广义逻辑分布(Generalized Logistic Distribution, GLD):这是对一些指数分布的对数形式的一个泛化。所以它包含很大一类分布的。常常模拟各种存活率。

广义伽玛分布(Generalized Gamma Distribution, GGD): 一般用来拟合生存数据,伽玛分布可以看成是泊松分布的一个推广,假如你每天有一个死去的概率,那么你最后能活多久的概率就可以用伽玛分布来拟合, 而GGD就是把Gamma分布,Weibull分布,和Exponential分布的一个统一。指数分布(Exponential Distribution)和几何分布(Geometric Distribution)是唯一的连续和离散的无记忆分布(Memoryless)。

综上,我们可以看到上面这些分布都是按一类需求,按照已有的分布重新进行扩展。因此他们形成了你中有我,我中有你的广义XX分布。

参考:

https://en.wikipedia.org/wiki/List_of_probability_distributions

https://en.wikipedia.org/wiki/List_of_probability_distributions

https://en.wikipedia.org/wiki/Exponential_family

https://en.wikipedia.org/wiki/Generalized_log-series_distribution

https://en.wikipedia.org/wiki/Generalized_gamma_distribution

https://en.wikipedia.org/wiki/Generalized_Pareto_distribution

https://en.wikipedia.org/wiki/Generalized_logistic_distribution

https://en.wikipedia.org/wiki/Generalized_normal_distribution

https://en.wikipedia.org/wiki/Generalized_extreme_value_distribution

https://en.wikipedia.org/wiki/Generalized_multivariate_log-gamma_distribution

https://en.wikipedia.org/wiki/Generalized_logistic_distribution

https://en.wikipedia.org/wiki/Generalized_Dirichlet_distribution

https://en.wikipedia.org/wiki/Generalised_hyperbolic_distribution

https://en.wikipedia.org/wiki/Generalized_linear_model

http://www.vosesoftware.com/vosesoftware/tmp/ModelRiskHelp/Distributions/Continuous_distributions/Generalised_logistic_distribution.htm?rhtocid=8.2.1.0_46

原文发布于微信公众号 - AI2ML人工智能to机器学习(mloptimization)

原文发表时间:2016-10-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Echo is learning

machine learning 之 多元线性回归

1483
来自专栏LET

谈谈我对投影的理解

2066
来自专栏大数据智能实战

基于Tensorflow的CycleGAN测试(非成对图像风格迁移:橙子--> 苹果)

图像风格迁移有两种大的类型,一种是成对的,一种是非成对了。 成对的著名模型就是pix2pix,这种的例子,如从影像地图转换为矢量地图,从素描转换为纹理图等。这些...

3948
来自专栏新智元

【资源】17个最受欢迎的机器学习应用标准数据集

【新智元导读】学好机器学习的关键是用许多不同的数据集来实践。本文介绍了10个最受欢迎的标准机器学习数据集和7个时间序列数据集,既有回归问题也有分类问题,并提供了...

82715
来自专栏专知

【专知-Java Deeplearning4j深度学习教程05】无监督特征提取神器—AutoEncoder:图文+代码

【导读】主题链路知识是我们专知的核心功能之一,为用户提供AI领域系统性的知识学习服务,一站式学习人工智能的知识,包含人工智能( 机器学习、自然语言处理、计算机视...

51511
来自专栏CreateAMind

论文:生成模型采样-类比学习应用 代码

之前发的这篇文章(之前内容在文章底部)介绍了生成模型的高效采样及隐变量空间特征特点,最近的How to Train a GAN? Tips and tricks...

1062
来自专栏IT派

人脸融合?没有想象中难!

颜如玉 —— python + opencv 人脸融合程序,可实现类似天天P图疯狂换脸、face++人脸融合效果

1.2K2
来自专栏机器学习之旅

理论:T级数据量下的划分聚类方法CLARANS+

定义是这样的,把一个数据对象,划分成子集的过程,使得子集内相似度大,子集外相似度小。这样的一个过程叫做聚类。

1023
来自专栏用户2442861的专栏

卷积神经网络CNN经典模型整理Lenet,Alexnet,Googlenet,VGG,Deep Residual Learning

欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld。  技术交流QQ群:433250724,欢迎对算法、技术感兴趣的同...

2191
来自专栏ATYUN订阅号

解决多标签分类问题(包括案例研究)

由于某些原因,回归和分类问题总会引起机器学习领域的大部分关注。多标签分类在数据科学中是一个比较令人头疼的问题。在这篇文章中,我将给你一个直观的解释,说明什么是多...

7506

扫码关注云+社区

领取腾讯云代金券