前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【统计学家的故事】现代统计科学的创立者:卡尔·皮尔逊

【统计学家的故事】现代统计科学的创立者:卡尔·皮尔逊

作者头像
统计学家
发布2019-04-10 15:24:43
4.1K0
发布2019-04-10 15:24:43
举报

卡尔·皮尔逊(Karl Pearson,1857年3月27日~1936年4月27日)是英国数学家,生物统计学家,数理统计学的创立者,自由思想者,对生物统计学、气象学、社会达尔文主义理论和优生学做出了重大贡献。他被公认是旧派理学派和描述统计学派的代表人物,并被誉为现代统计科学的创立者。

人物生平

早年经历

卡尔·皮尔逊1857年3月27日出生于伦敦。父亲威廉·皮尔逊是王室法律顾问,母亲范妮·史密斯。父母双方的家庭的祖上都是约克郡人。1866年皮尔逊进伦敦大学学院学习。1873年因病退学,接下来的一年里在希钦由家庭教师教育。1875年获得剑桥大学国王学院奖学金入学学习。1879年获得学士学位,在剑桥数学荣誉学位考试中获得第三名。在他从国王学院毕业后的几年里他尝试了很多事情,是他人生发展的重要阶段。

接下来的一些年是皮尔逊智力全面勃发的重要时期。1880年4月国王学院给他提供了研究会员身份,使他在随后的几年获得了经济上的独立。他利用这一时机按照自己的爱好读书、学习, 通过信件、诗歌、批判性的评论、随笔和讲演展示自己的才智和表达能力。毕业后,他马上来到德国。从1879—1880年,他先在海德堡大学学习物理学和哲学,然后到柏林大学学习了罗马法,还听了埃米尔·杜波·雷蒙德讲授的达尔文进化论课程。不久,他对德国民俗学、中世纪和文艺复兴时期的德国文学、宗教改革的历史、德国人文主义和路德的特征以及妇女问题等发生了浓厚兴趣。自1882年至1884年,他就德国的思想史、人文等做了一系列讲座。

教学工作

1884年,他受邀担任伦敦大学学院应用数学和力学哥德斯米德教席教授。在前6年,他显示出坚韧不拔的工作劲头和异乎寻常的多产性。他的专业职责是讲授静力学、动力学、力学等。他用直观的作图法深入浅出地讲解力学问题,很受初学者欢迎。1890年,皮尔逊和玛利亚·夏普结婚。1891年他开始担任格雷沙姆几何学教授。1891年的格雷沙姆讲座的头七次讲演,为皮尔逊的科学哲学名著《科学规范》勾勒了蓝图。皮尔逊在此基础上经过深化和扩充,于1892年2月出版了《科学规范》,该书的许多章节用的就是讲演的题目。

统计研究

1889年,高尔顿出版了著作《自然遗传》。书中概括了作者关于遗传的相关和回归概念以及技巧方面的工作,明确思考了它们在研究生命形式中的可用性和价值。皮尔逊对高尔顿的“相关”这概念十分着迷,认为这是一个比因果性更为广泛的范畴。皮尔逊立即决定全力为统计学这一新学科奠定基础,他在接着的15年内几乎是单枪匹马地奋战在这一前沿领域。他结合准备格雷沙姆讲座和大学学院统计理论的两门课程,对来自生物学、物理学和社会科学的统计资料作了图示的、综合性的处理,讨论了概率理论和相关概念,并用掷硬币、抽纸牌和观察自然现象来证明它们。他引人“标准离差”术语代替麻烦的均方根误差,并论述了法曲线、斜曲线、复合曲线。皮尔逊在高尔顿、韦尔登等人关于相关和回归统计概念和技巧的基础上,建立了后来所称的极大似然法,把一个二元正态分布的相关系数最佳值p用样本积矩相关系数r表示,可以恰当地称其为“皮尔逊相关系数”。在1901年,皮尔逊与韦尔登、高尔顿一起创办了《生物统计》杂志,从而使数理统计学有了自己的一席之地,同时也给这门学科的发展完善以强大的推动力。

晚年生活

1828年,他的妻子玛利亚去世。1929年,皮尔逊和生物学实验室的同事玛格丽特·维多利亚·蔡尔德结婚。1932年7月,皮尔逊正式通知大学学院,他要在翌年夏天辞职退休。1933年10月,校方同意他的辞呈,并按照他的意愿为他在动物学系保留了一个办公室。他只要有可能,还像以往那样按照学院的作息时间规则地生活和工作。他在数学领域还是活跃的,并与人合作写了一篇论述克伦威尔执政时期的历史论文。他假期喜欢去距伦敦不远的萨里郡的金港湾度假,步行10多英里到一个鲜花盛开的坡地。而对生机勃勃的大自然,他不由自主地哀叹:“当我们正想专心工作时,我们却太老了。”1935年,皮尔逊的精力明显衰退了。繁忙的工作终于耗尽了他的体力,尽管他依然渴望为他献身的事业继续尽力。直到弥留之际,他还坚持看完了《生物统计》第28卷的几乎全部校样。1936年4月27日,皮尔逊在金港湾去世。

学术贡献

统计学

在19世纪90年代以前,统计理论和方法的发展是很不完善的,统计资料的搜集、整理和分析都受到很多限制。皮尔逊在生物学家高尔顿和韦尔顿的影响下,从九十年代初开始进军生物统计学。他认为生物现象缺乏定量研究是不行的,决心要使进化论在一般定性叙述的基础之上,进一步进行数量描述和定量分析。他不断运用统计方法对生物学、遗传学、优生学做出新的贡献。同时,他在先辈们善于赌博机遇的概率论研究的基础上,导入了许多新的概念,把生物统计方法提炼成为一般处理统计资料的通用方法,发展了统计方法论,把概率论与统计学两者熔为一炉。

他在统计学方面的主要贡献是:

导出一般化的次数曲线体系

在皮尔逊之前,人们普遍认为,几乎所有社会现象都是接近于正态分布的。如果所得到的统计资料呈非正态分布则往往怀疑统计资料得不够或有偏差;而不重视非正态分布的研究,甚至对个别提出非正态分布理论的人加以压抑。皮尔逊认为,正态分布只是一种分布形态,他在高尔登优生学统计方法的启示下,在1894年发表了《关于不对称曲线的剖析》,1895年发表了《同类资料的偏斜变异》等论文,得到包括正态分布、矩形分布、J型分布、U型分布等13种曲线及其方程式。他的这一成果,打破了以往次数分布曲线的“唯正态”观念,推进了次数分布曲线理论的发展和应用,为大样本理论奠定了基础。

提出卡方(χ2)检验

皮尔逊认为,不管理论分布造反得如何好,它与实际分布之间总存在着或多或少的差异。这些差异是由于观察次数不充分、随机误差太大引进的呢,还是由于所选配的理论分布本身就与实际分布有实质性差异,还需要用一种方法来检验。1900年,皮尔逊发表了一个著名的统计量,称之为卡方(χ2),用来检验实际值的分布数列与理论数列是否在合理范围内相符合,即用以测定观察值与期望值之间的差异显著性。卡方检验提出后得到了广泛的应用,在现代统计理论中占有重要地位。

发展了相关和回归理论

皮尔逊推广了高尔登的相关结论和方法,推导出人们称之为 “皮尔逊积动差”的公式和两个其他相当的分工,给出了简单的计算:说明对三个变量的一般相关理论,并且赋予多重回归方程系数以零阶相关系数的名称。他意识到只有通过回归才能回答韦尔顿提出的关于出现相关器官的选择问题,意识到要测定复回归系数值,广泛搜集所有变量的基本平均数、标准差和相关的数据。他提出了净相关、复相关、总相关、相关比等概念,发明了计算复相关和净相关的方法及相关系数的公式。

重视个体变异性的数量表现和变异数据的处理

皮尔逊认为,在各个个体之间真正变异性的概念,与在估算一个单值方面的误差之间的机遇变异有着很大的差别。对这个观念的强调,是他对生命了解的真正贡献之一。他在1894年那篇关于不对称次数曲线的论文中,提出了“标准差”及其符号 σ。

推导出统计学上的概差

皮尔逊推导出他称之为“频率常数”的概差,并编制了各种概差计算表。这是他自己认为的最重要贡献之一。这些概差对于先前缺乏度量的大多数统计资料的抽样变异性,标志着很大的进展。[4]

优生学

皮尔逊在把生物学观念应用到人时,特别是在为优生学谋求理论基础时,特别注意这样三个证据:人变异,这些有利的或不利的证据被遗传下去,它们被选择。他感兴趣的特征有三个,即身体的、病理的和心理的特征。他认为从雄辩的断言到统计的证明是优生学的特色,并把下面三个陈述作为优生学建筑物的基础:抛弃语词讨论而代之以统计事实;应用新的统计法;从三个基本的生物学观念作为基础。这三个观念是:第一,本性和培育的相对权重不必先验地假定,而必须科学地量度;当代学界的普遍观点是本性比培育占优势,遗传比环境更重要。第二,可以表明不存在获得性性状的遗传。环境更改现存一代的身体性状,但并不更改下一代出生的种质。第三,所有人的品质以显著的、可能同等的程度遗传。

正是在这样的理论基础上,皮尔逊提出了他的优生学的基本观点。在他看来,在大量人中的遗传像在其他生命形式中那样是相同的,这种遗传覆盖了身体的和心理的特征。也就是说,进步所依赖的体格和“心格”都是可遗传的。未来社会什么样类型的人是最好的并不确定,但可以确定的是健康、心智健全、理智能力没有充分显示出来的社会是不能存在下去的;健康、心智健全、诚心诚意和能力是遗传的特征。于是,培育和教育虽然可以直接地有助于社会机器,但必须被一代一代地重复,而且这样做并不会减少坏血统的产生。只有有意识的或无意识的选择才能达到这一目的。因此,致力于通过环境变化而改进种族的立法不仅可能是无效的,而且可以肯定是有害的,倘若它的结果是修正选择行为的话。

人物评价

英国统计学家乌德内·尤尔这样评价皮尔逊:

“他是一个知性论者,但内心充满热情:诗人、散文家、历史学家、哲学家、统计学家——他对生命中遇到的所有知识领域都充满兴趣。他总是充满无休止的激情:有点强势、好战,有时则顽皮。”

英国皇家统计学会在发的讣告中这样评价他的教学工作:

“没有哪个学生能够忘记皮尔逊上的课是多么的清晰易懂;他的另一个学生在《泰晤士报》说他上课从来不需要教科书。”

美国生物学家雷蒙德·珀尔说:

“历史的进展清楚地显示出有极少数的人,没有靠地位或者环境,而仅仅靠他们自己的聪明才智,对人类的思维模式产生了巨大的影响……卡尔·皮尔逊就是这少数杰出人物中的一个。”

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2015-06-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 机器学习与统计学 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档