统计学入门必看,别走这样的弯路

来源:果壳网 作者:清扬婉喵

导读

想要打通统计学习的任督二脉,爱上统计学吗?今天为大家推荐一篇果壳网网友清扬婉喵的文章,文中不仅系统盘点了统计学习的经验和感悟,更对统计的学习资源做了悉心标注和罗列,对统计学入门的新手以及跨学统计专业的朋友们来说,依然有一定的参考和借鉴价值。

作者简介

毕业于美国一个统计学专业排名前10名的公立大学。今年6月刚刚毕业。从大二上第一门统计专业课算起,已经和统计学打了三年的交道了。我从最开始bychance进的专业,到觉得这个专业无聊,再到开始对这个专业不讨厌,最后到现在觉得这个专业很性感,决定和统计学继续把交道打下去,其实中间还蛮曲折的。属于非常努力的那种学生,但是因为天赋有限,所以“努力”让自己在整个专业中的成绩稳定在中上游,“缺乏天赋”使自己没有能成为最优秀的。但是就是因为这样,才觉得自己在学习统计学方面的经验和体会对于大部分组员们还是很一定参考价值的。

相信大多数刚进来统计学专业的弟弟妹妹们,对统计学的理解就是限定于“概率”。比如一个袋子里面3个球,两个红的,一个白的,蒙住你的眼睛,问模到白色的球的概率是什么。我当时觉得这就是统计学,统计学就是这个。所以就导致了在学基础的数理统计的时候,对基础理论的掉以轻心,以导致之后花了1000%的力气去弥补当年的损失。为了避免学弟学妹们和我一样犯同样的错误,我一定会在这个帖子中好好承认我当年的问题,总结我当年血一样的教训,希望大家在读了这帖子后,有点启发,少走点弯路,多点时间去锻炼身体,以便更好地享受你和统计学有价值的时光。

1.关于专业的选择:你一定要给你自己一个机会

相信有很多看到这篇帖子的同学还没有学习过这门专业,或者说是打算尝试下这门专业。从我的角度来看,我觉得大家不管上第一门统计课的动机如何,都应该给这个专业一个走进你的机会。不单单是对于统计这一个专业而言,其实是对于所有专业都是这样。我为什么这么讲呢?我高中是文科生。数学一般。物理奇烂。高一期末分科考试,因为物理不计入总体成绩,我又打算学文,于是就破罐子破摔,物理以17/120的成绩结束了我人生中最后一门物理课。真的是人生中最后一门物理课哦,这种恐“物”心理一直延续到我大学毕业,都没敢再上一门物理课。

我来美国读本科以后,其实也非常排斥数学,也因为我是文科生,从高二分科后,就觉得自己数学不好。其实这种心理暗示很恐怖的,自己总是觉得数学不好不好,就越发真的不好。于是本科打算进的专业也不能和数学有太大关系,于是就说学经济吧。后来发现,自己对专业的选择是多么幼稚可笑。学经济的人的数学能力应该是非常非常强的。我记得我的一个助教,她过去是北航学习物理的,现在是我本科学校的phd。她说经济学中的数学推导是最令人发指的,发指到她算着算着就不知道自己到底为什么这么算了。所以说大家在进去专业前,一定了解这个专业的性质是什么。我当时选择经济,就是因为国人都学,觉得这个是个很高级的专业。没有想到的是,经济学就要读PHD才有出路,且就业压力极大,除了faculty这条路基本上没有什么路了。

然后,大一上着上着的时候,知道了原来学校还有一个专业叫AppliedComputationalMathematicalScience,简称ACMS,是应用数学专业的一个本科分支。这个专业有个分支是数学经济。我觉得要不再选择个这个专业吧。虽然有点数学课,但是硬着头皮也能读下来,何况美国人民数学不好。于是我就又加了一个专业,就是这个ACMS。这个时候,我有了两个专业。所以大家在学一个专业或者课程前,千万不要根据自己过去的经历给自己下定义,为什么呢?因为我发现我自从选择了这个专业,要逼迫自己开始学数学的时候,我渐渐发现学数学真的很有意思。数学前几门入门课,都是几百人上的,里面鱼龙混杂,拿个高分不难。这种“假高分”就让我觉得学得挺有成绩感的。成就感真的会成就你对一个事物的兴趣的。后来上了高级别的课程,每个班级只有30个人的时候,那个时候的30个人都是真正的数学专业的,GPA比较难拿。但是因为尝试过,也比较喜欢,所以那个时候学习数学就是兴趣为先,GPA次要。现在有的时候,真的再想,当年应该学门物理课的,没准我现在就是物理专业了。

后来我是怎么又学了统计学呢?我大一结束的时候,去找ACMS的顾问,也就是advisor,讨论选课的事情。她看我上课上得蛮快的,说现在有一门叫做数理统计学的课程,是开学后秋天开始上,挺好的,问我想不想上。我当时想,什么是统计。我其实那个时候连statistics这个单词都要反应半天。就和advisor讲我还是不上了,因为不知道是什么。这个advisor超级热心,说这课报的人比能接纳的人多,而且一年一次,趁还有空余位置,就把我加进去,等我上了第一节课,再决定放不放弃。然后我一听,也好啊,反正没损失。之后就在2010年的秋天上了人生中第一门真正意义上的统计课。当时之所以没有在第一天扔掉这门课,就是发现想上这课的人真的好多好多,但是大部分都不能如愿,还要等一年才能上,自己有种赚到的感觉。

所以,学弟学妹们,一定要给你自己一个和陌生学科接触的机会。千万不要因为自己是文科生就觉得自己玩不了数字,也不要因为自己是理科生玩不了文学。一定要尝试,选专业如此,今后的路更是如此。可能你给自己的这个机会能改变你的人生轨迹。我就想如果我当年没有遇到这个热心的advisor,没有决定在那节课上待下去,我现在可能正在发愁到底学不学经济学,或者转不转专业的问题。

2.关于选择几个专业:一定要精致,精致,再精致

我觉得我大学四年中,很遗憾的一件事情就是选择了三个专业。三个专业的好处是接触的知识多,范围广,找工作时候的对口工作多。但是对于大部分智商平常但又非常努力的童鞋们来说,弊绝对是大于利的。为什么呢?

人的精力是有限的,做得多就意味着做不精。三个专业,又想拿好的GPA,就意味着每天的日子不是为了学知识活的,而是为了GPA而战的。这种学习方式,就是学不精致:只要学到考试点上,绝不深究。不是因为不想深究,而是因为另外一门专业还要时间去保住GPA。如果让我重新选择,我会在我大二的时候放弃掉经济专业。把ACMS的专业方向从数学经济改成OperationResearch,匀出些时间学统计专业里面的选修课程。还要匀出时间和教授做相关的research。这样自己统计方面的知识储备就更加完善。因为,对于一个真正想在统计学这条路上走下去的人来讲,本科阶段放弃了这种探究同领域不同方向的机会真的是很大的遗憾。尤其是对于统计学这种研究性专业来讲,在未来申请硕士和博士的时候,还是非常看重你本科的专业背景的。

所以,如果你们找到了自己真正喜欢的专业,改舍弃的东西,一定要毫不犹豫地舍弃。千万不要图多,要精致,一定要精致。何况,现在想想,其实把一个专业学精致了,找到的工作只会好不会差。

3.零基础,入门统计学

在这部分中,我想根据自己大学中学习统计学的经验,介绍下如何在零基础的前提下完成统计学的入门。所以这部分的内容无论是对于本科阶段没有接触过统计的同学,还是小组中想了解这方面内容的前辈们都很适用。当然,如果你已经完成了本科阶段统计的学业,你可能是统计专业或者相关领域的研究生,PHD或者已经工作数年的职场达人,欢迎你来补充和critique我写的内容。

下面我根据我的学习内容,把统计学入门应该学的基础课程分成数学部分,编程部分和统计部分三个部分加以罗列。每个建议的topic下我都列出了建议使用的书籍以及对应的Amazon上的地址,有一些我还列出了一些网上课程的资料,希望能够减少大家花在google上的时间。虽然我学统计的时候,是不得不用英文学习,我还是建议大家直接学习英文课本。按照我周围人大部分人的经验来看,英文描述学术方面的语言更加简练易懂。总之,下面的书也都有中文译本,大家根据自己的实际情况选择最适合自己的方法就好。

A:数学部分:以下内容按照顺序学习就好

解析几何和微积分

教科书是Stewart写的

Calculus

数学逻辑

DanielJ.Velleman的

HowToProveIt:AStructuredApproach

基础微分

Boyce-DiPrima的

ElementaryDifferentialEquationsandBoundaryValueProblems

矩阵代数及其应用

DavidPoole的

LinearAlgebra:AModernIntroduction

实分析

Taylor的

AdvancedCalculus

线性代数

JohnH.Mathews的

NumericalMethodsUsingMatlab

MIT的

LinearAlgebra公开课

B:计算机编程部分:没有必然的先后顺序之分

JAVA

关于使用哪个平台,我不是expert,大家问问周围的专业人士们,然后告诉我,我来更新。我使用的是jGRASP。这个应该是最常用的了。因为自己当初学JAVA就是应付差事(大家千万别学我)。

其实很多学习CSE的同学喜欢eclipse,更方便。

教科书是使用的Reges和Marty的Building Java Programs: A Back to Basics Approach. 这本书也是U of Washington的两门基础JAVA编程课,CSE142和CSE143,的教科书(非必买)。先上完142成绩合格了才能上143。这个两个课程的网站对外是公开的。真的是非常好的课程。我也看过很多JAVA的课程和公开课,这两门课程无论是从质量和难度上,绝对是JAVA课程中的上品。你如果认认真真完成了

每个作业,即使是对于计算机专业的同学,也是非常大的提高。这两节课最初就是由教科书的两位作者上的,虽然说Marty现在抛弃了UW去了Stanford,我还是怀念他四年前给我上这门课的场景。Reges也非常非常非常棒,我的第二门课是跟他的。他是那种能把编程这么无聊的事情讲成非常浪漫的事情的教授。他现在还是在UW为了这个课程的发展而拼搏。

CSE142

CSE143

R语言:统计学中最重要的工具,没有之一

我最早用的就是CRAN的发布的R语言环境,现在用的是RStudio,好用太多,强烈推荐大家去下这个。

讲R语言的书很多很多,每本书都有它存在的闪亮点。我觉得有机会应该具体讨论下R语言的学习。根据我的感受,看书绝对不是学习编程的最佳方式,但是绝对是最笨的方法。编程是作为工具存在的。非CS的同学,在学习编程方面要功利些,也就是有针对性地学习:有用的学,没用的就没有必要钻研(当然,如果日后打定主意走上统计这条不归路的时候,还是要深入学习,比如我)。这里有几本我觉得蛮有用的书籍。大家千万不要掏腰包买,下载就好(我不能这么误导,但是真心觉得这种工具书,不值得买啊)

Rfor Dummies, Rina Nutshell, Michael J. Crawley的TheRBook(这本书的中文版年末或者明年年初上架,问我为什么知道?因为我和另外几名战友在翻译这本书)

看来真有必要好好细致讨论下如何学习R:)

Matlab

Matlab据说在淘宝上可以买。在米国的话还要买正版,还好是学生价,99刀,虽然也不便宜,但是和非学生价相比,我实在是谢天谢地。话说在国外的同学们,还是能用正版尽量用正版。我有认识人被抓住罚了2500大洋就是因为用学校网络下载盗版windows。虽然非常少发生,但是一旦发生了的话,2500大洋在美国能买25套windows正版系统了。

Matlab实在没有什么好的书推荐,因为我只是在学习线性代数的时候使用Matlab。平时都是使用R。但是有一个手册比较好。我当时学习matlab的时候就是靠它还有google写的作业。加上上面线性代数里面推荐的那本Matlab的书籍,应该够用了。

LaTex

写作业必备神器。大家不用专门买书的,其实google和LaTex网上的一些手册就够了。如果真的想系统学,Helmut和Patrick合著的GuidetoLATEX还是不错的。

还有介绍个LaTex模板的网站,我感觉这个更常用些,我们的作业都是靠这个模板弄的。

C:统计学学习部分

这部分开始真正意义上介绍和统计核心课程相关的学习内容。和与数学部分不同,这部分中的学习完全可以和我在计算机编程部分中讲的知识相互贯穿来学的。尤其是R语言的学习,对统计的了解和学习是及其有帮助的。

这个是重中之重。其实数理统计本身并不是多难,稍微有一些数学微积分基础的同学,掌握这部分内容应该非常快,但是想掌握扎实并且灵活了,非常难。好比说统计学中最基础的一个概念:平均数。不学统计的同学们也知道,平均数就是把所有的数据相加除以数目。但是学了数理统计的童鞋们,如果你们对平均数的概念就只是这样,那你们真的应该好好翻翻书再复习下了。

初中老师讲平均数的时候,还讲了中数,除了这些还讲了条形图,扇形图等各种各样的图。为什么要讲这些?为什么要讲平均数?其实在这个阶段,就是为了教你如何直观地观察数据,让你对数据有个直观的把握。后来我们学了variance,就发现,原来描述数据的时候,mean不准确,我们要结合variance才能更准确地明白数据。之后又有结合参数来讲mean。简单的算术mean和为了衡量参数而衍生出来mean有着不同的意义。这个mean可以用maximumlikelihoodestimator求得,也可以用methodofmoments求出。不同的distribution有mean,randomresampling中有mean,做regressionanalysis的时候要用mean,连做statisticalinference的时候还是要用到mean。Mean真是无处不在。虽然说这些定义还算是基础,但是非常容易搞混,一旦搞混了,你接下来的很多东西都不能学了。每天积攒点糊涂了,几个月下来就真的糊涂了。

这里推荐大家一本书

Larsen的Introduction to Mathematical Statistics and It's Applications (5th Edition)

他还配套一本参考答案,不过这本答案只有课后题的奇数题目的答案,偶数题目的答案只有教师用书上有。如果不会的话,只能google。

Student Solutions Manual for Introduction to Mathematical Statistics and It's Applications

这本书算是我见过的所有的数理统计学书中最最简单直白的了,他前面一二章讲的是非常基础的概率知识,然后徐循渐进到较难的部分。整本书将近千页,但是对大家的数学水平并没有很高的要求,只要微积分基础还算是扎实,稍微知道点实分析中的分散和收敛就可以了。不过,这本书信息量也非常大,覆盖的内容也很广。我学数理统计学的时候,就是用的这本,连续三个学季,也就是9个月才把这本书从第一页学到了最后一页。到了后来学习更难的课程的时候,还要经常翻书来温故而知新,也可见本书对日后的学习有多重要了。这里我给大家分享下我学习这本书的心得,希望对自学的童鞋们有些帮助:

1).这本书最重要的是所有黑字的定义和公式。一定要把它们理解清楚了。包括大写的X和小写的x的具体定义,这些都要区分清楚。什么是value和randomvariable,什么是estimator和estimates。统计中这种看着一样的概念很多,要区分;

2).每道例题都要仔细弄懂,因为那些题目都非常有典型性。各种的经验和教训不断教育了LZ这些例题对日后学习有着非同寻常的意义;

3).如果有时间,大家可以试着做下课后练习,可以帮助你更好地理解概念。我觉得这些联系不但要做,而且在没有到最后关头,不能看答案,最好能和人一起讨论下,这点应该对在校统计专业的弟弟妹妹们的一个基本要求;

4).如果很忙,非要给这本书分个层次的话,前12章是必学,最后两章可以选学:

a.一章到四章是最基础的部分:

i.其中一章到三章是基础中的基础;

ii.第四章开始讲分布。对于分布,大家应该了解的内容,可以见我们组里面发起的那个活动上面的内容,对于统计专业的童鞋,这些内容都是要大家融化在血液中的;

b.第五章是在第四章的基础上建立展开的,讲estimation。通过这章,大家对分布中的estimator的性质会有一个更立体的了解;

c.第六到第九章是讲statisticalinference,这个是日后大家学统计学用到的最多的东西;

d.第十章到第十二章是讲基础的regressionanalysis和AVOVA。如果大家以后有机会做dataanalyst方面的工作,做dataprediction少不了regression,但是那个时候混合着其他概念,会更加复杂;

e.最后两章是experimental design和nonparametric statistics,这些都更加接近现实生活一点,就是在不知道现有数据分布和参数的情况下,如何做统计分析。当然讲得也非常浅显。

所以整体来讲Larson的这本书比较基础,但是每章之间的衔接非常紧密,这点应该和我一会儿推荐的书有所不同。那本书可能前面某章不懂,后面的章节还能明白,这本书一旦有一点知识弄不清楚了,后面的跟着也就不清楚了。

下面就推荐下这本,建议有一定理论基础的和统计专业的同学看看,是Edward的Modern Mathematical Statistics

这本书没有Larson的讲得广,比如regression的部分根本没有提。但是这本书中每个topic的讨论都深入很多。比如methodofmoments,Larson的书里面只花了2页提了一下概念和对应的简单的而应用,但是这本书用了12页的内容讨论。这本书可以作为Larson的补充来学习。

基础数理统计最后要学到什么程度就说明你学得算是扎实可以进行下一部分的学习了呢?就是给你一篇统计学的paper,你可以根据paper中的逻辑,把他的演绎过程再自己演绎一遍,并且在不翻书的情况下,能说出每步的逻辑原理并加以描述论证。

4.回归分析regressionanalysis及其应用

在数理统计的脉络疏通的前提下,可以开始学习回归分析。根据自己和周围人的感觉来看,从这部分开始就比较地抽象。不像是数理统计,即便不明白,仔细钻研几天还能弄明白。回归分析最大的难点是,本身就是非常抽象,因为涉及到矩阵分布的内容,加上对数理统计的功底深,要是任何一点不扎实,这部分肯定越学越崩溃(真的是要用崩溃二字形容)。

此外还建议大家好好学习线性代数的内容。我上文也有讲,还有推荐的公开课。

首先大家要弄清楚最基本的scatterplot,很多人觉得这个太简单了,没人重视,实际上scatterplot可以帮助你对regression有个大体的感觉。你通过学习这部分,知道了什么是outlier,知道了不同的correlation coefficient大体对应的图的形式,知道了给你很多数据,你是怎么把那条回归线画出来的。通过学习这种是geometric sense的概念,才容易理解simple linear和multiple linear regression这种datasense的抽象事物。

还是先推荐几本书:

Douglas C. Montgomery的Design and Analysis of Experiments

Sanford的Applied Linear Regressi on(Wiley Seriesin Probability and Statistics)

前两本都是很传统的讲线性回归的书籍,无论从内容还是从结构上来看。其中Sanford的更加基础。

但是,我最推荐的是Freedman的Statistical Models: Theory and Practice

虽然这本书很便宜,但是它真的是物有所值。和很多的学究派的教科书不同,如上面两本,这本书本身是可以拿来当小说读的,语言非常口语化。读的时候,本身就有感觉是Freedman在亲自给你授课。这本书前半部分是讲回归的,很有特点的是书后面很大的篇幅是书中所提到的论文的原文,这样非常便于你随时查找相关论文的原文从而便于你理解。线性回归很多时候单讲理论的东西,非常晦涩难懂,但是一旦有一个实例,就非常容易理解了。而且本书的附录里面附有大部分难题的答案。还有matlab的code,相信想学matlab的童鞋可以参照这本书来学习。即学习了程序,也学习了统计,一举两得。这本书唯一的一个缺点是,内容过于精炼,所以可能学习来要查很多的资料才能够明白,不过前两本材料是很好的辅助材料。线性回归还是选取难点的教材比较好,因为是从上层来观察下层建筑,这样比较方便了解自己漏的部分。而且相信这本书语言的通俗性,也能让读者更清晰地领会到所需要明白的重点内容。再说下Freedman,本身就是位统计学界德高望重的老爷爷。他是UC-Berkeley的统计学教授,发展了Bayesians和Bootstrap。相信学Machine Learning的同学都听该听说过他。他把统计学的研究拓展到了经济学,医药学,流行病学等等。这本书是2005年出版的,也是在他2008年去世前三年出版的,也应该算是糅合了他所认为的回归分析中最精华的内容。

5.R语言的学习

原本上面已经提到了R语言,但是因为R作为一个工具的存在,可以让你更好地理解统计分析。我和周围的同学都没有刻意地去学习R语言。因为我们的作业都是需要用R完成的,所以为了写作业,我们都逼迫自己在写作业的时候去学习R。但是,请大家务必把教课书中的Rcode弄明白。

主要的学习途径有这么几个:

1).labsection的Rnotes。

教授的讲义和TA的讲义中所有用R的地方都会在Labsection上重新演绎一次,我也会私下里再把Rcode重新compile一次;

2).做作业和讨论。

感觉讨论在统计学中还是很重要的。一个好的统计专业学生,不但是做题好的,写code好的,更重要的是交流好的。好的交流着才能在交流过程中碰撞出解决问题的途径。同样,和同学讨论code才能帮助你理解。

3).Rhelp和google。

之前介绍了统计基础学习,相信如果大家按照上面的方法自学,应该会有一个不错的统计基础。但是对于大部分同学,学统计不是单纯地为了背概念和推公式。我一直都是喜欢应用性和实践性强的东西,这是统计的魅力所在。学了就能用。和很多生统和统计界的人聊过,他们说对于大多数专业来说,学到PHD学位,真正工作(如果不搞学术)中用到的东西很少很少。但是对于统计和生统专业来说,学校学习到的90%的知识都会在工作中直接应用。

好了,不扯这么多了,这章主要介绍下统计后期学习的各个分支。其中很多方面,我也是只有些接触,了解真的不是非常多。毕竟作为小本刚毕业的我知识有限,我就是尽量把我知道的资源推荐给大家。我也尽量不出错误,十分欢迎大家批评拍砖讨论。

a.运筹学

至今为止,感觉到统计学分支之下或者相关的科目中上过的比较有意思的科目之一。一般本科阶段没有这个专业的设置,只是有选修课程或者方向。到了研究生阶段才会有单独的专业或者是单独的研究方向。但是据说单纯靠运筹徐就业得话,形势不是很好。但是,我总是觉得就业是看个人的,再差的专业,人优秀也能找到好的职位;再好的专业,也有出来找不到工作的孩纸。

其实从我对统计学的理解来看,我觉得运筹学蛮像哲学的,讲的就是在资源有限的前提下如何更好得分配资源,或者是在复杂的情况下,用什么样的方式能够解决问题。所以上运筹学的课程,乐趣是在于解决问题。当时上课的时候,做过两个project。一个是关于线性规划,另一个是关于MarkovChain的。

线性规划的课题设计是关于学校餐厅的配餐设计。当时找了50多种食材原料还有比较大众的零食,搜集了它们的价格和营养成分。营养成分包括卡路里,蛋白质,维生素什么的。目的是根据不同人群对食品的需求,比如肥胖人士,严格素食主义者,糖尿病患者,gluten过敏人士等等,在这些要求下什么样的配餐能把价格压到最低。

Markov Chain的课题做的非常有意思,应该算是我大学阶段最有创造性的课题了:就是用Markov Chain作曲。当时找了我们学校音乐专业的学生用钢琴弹曲子。然后我们把每个曲子按照开头,中部,和结尾剪成三段相同长短的clip,再传送到java里面,通过改变transition matrix找到最合适的概率,演奏音乐。因为实在没有时间,只有两周,所以transition matrix是手工试的,否则应该有更好的方法。

强烈推荐一本针对运筹学的书:

Operations Research: Applications and Algorithms

这本书涵盖了所有的operation research的topics,读起来算是直白清楚。不深,但是面广,对于想直观了解运筹学的孩纸是除了wiki以外最好的方式。

下面是三个运筹学的方向。上面那本书中其实都有讲,只是下面单独讲就更深入些。每个方向都有无数本书可以看。但是那些书大部分深奥难懂,还不如笔记清晰。如果在上面的书看了后,大家还有兴趣,下面是一些笔记可以看看。

Linear Programming的笔记

Non-Linear Programming的笔记

Discrete Optimization

b.Stochastic:

运筹学下的一个分支,但是还是想单独说第一次接触stochastic是在大二的时候上经济学系下面的两门金融课程。当时我还在上人生中第一门统计课,其实那个时候除了概率其他的都懵懵懂懂的。Stochastic,当时选这课是因为stochastic和stock在写法和发音上面都很像。觉得stochastic就是讲股票投资的。后来才知道stochastic是随机性。但是不管怎么说,歪打正着学了个统计相关的课程。

这里想说个关于我对统计的感觉。从上面写的,大家知道我第一个确定的专业是经济。我属于凡事爱往复杂想的那种。其实这种性格的人,在学经济这种social science的初期是非常痛苦的。为什么呢?比如我大学第一个学期学的基础微观经济学,书里提到GDP。我就想GDP怎么算的啊,国家那么大怎么能保证这个GDP准确呢?然后书里出现失业率,计量经济学公式,书中种种事物,我都会质疑半天,最后自己就只好死记硬背,因为觉得所有的东西都讲不通。直到学了统计学以后,才了解到sample,survey和experiments design在social science的应用,也了解了计量经济学中的统计原理,才觉得经济书上的东西有理可依有据可循。所以说,统计还是一门很答疑解惑的学科。学了统计学,就可以相对容易地掌握很多其他学科的内容。

可能鉴于每个人学一门学科都是这种感觉:没有基础,学上层建筑是空的。所以,一般学习stochastic是先学习统计基础理论,再放回到金融理论中学习。或者很多人和我一样,先学的金融理论,再学习统计基础。我觉得哪种方法都有它好的一面和不好的一面吧,这个就要看个人了。

统计学中对Stochastic最有帮助的几个知识要点:

1).概率和条件概率:不多说,所有学科的基础;

2).Poisson Distribution;

3).Randomwalk, Martingales and Brownianmotion(密集型恐惧症慎入);

4).Markov Chain:大家见“运筹学”;

5).Stationaryprocesses。

经济学、金融学中的Stochastic的应用:

Black-Schole

Zivot的部分关于stock的笔记

虽然stochastic接触不少,但是真正深入的没有怎么学,都是基于统计学的。书就没有什么推荐的了。欢迎专门学这个的同学在小组中分享你的心得。大家如果对Stochastic方面真的非常有兴趣的话,不防看看CFA的教材。如果有机会,也可以选学金融工程方面的课程。应该还是很有意思的。

未完,前几天LZ有点小忙,这几天还在更新高级课程方面的学习和统计专业延伸课程的学习。写这部分,真的感觉自己力不从心。我果真是个小本,真的往某个领域深入了讲就没什么太多的可讲了。所以,大家还是好好学习,天天向上吧,技多不压身,何况自己的专业。

(注:本文有一定删减和改动)

END

版权声明: 转载文章均来自公开网络,仅供学习使用,不会用于任何商业用途,如果出处有误或侵犯到原作者权益,请与我们联系删除或授权事宜,联系邮箱:holly0801@163.com。转载大数据公众号文章请注明原文链接和作者,否则产生的任何版权纠纷与大数据无关。

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2016-08-02

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

学界|运筹学教授叶荫宇:作为 AI 基石,优化算法如何在实际中应用?

AI科技评论按:昨天,AI科技评论报道了钛媒体和杉数科技主办的 2017 AI 大师论坛,其中,杉数科技首席科学顾问叶荫宇出席了活动并发表了学术演讲。作为在运筹...

42812
来自专栏CSDN技术头条

深度长文丨大数据,小数据,哪道才是你的菜?

美国著名科技历史学家梅尔文•克兰兹伯格(Melvin Kranzberg),曾提出过大名鼎鼎的科技六定律,其中第三条定律是这样的[1]:“技术是总是配“套”而来...

61110
来自专栏邱翔的终身学习

iPhone X的Face ID有多安全?

33010
来自专栏镁客网

奥斯卡大乌龙,然而人工智能也预测《爱乐之城》为最佳影片

1343
来自专栏AI科技评论

直击 SMP 2018 六大特邀报告,看社会媒体处理的多领域应用

AI 科技评论按:由中国中文信息学会社会媒体处理专委会主办、哈尔滨工业大学承办的第七届全国社会媒体处理大会(SMP 2018)于 2018 年 8 月 2 日-...

772
来自专栏新智元

解读诺贝尔化学奖:在分子层面上制造机器,以及人工智能的未来

【新智元导读】2016年诺奖化学奖授予了三位“在分子机器的设计和合成”上做出杰出贡献的科学家,他们开发出了比人类头发丝直径还要小1000倍的分子机器,而且从微型...

3525
来自专栏大数据文摘

凯文•斯拉文:算法塑造世界

1975
来自专栏数据科学与人工智能

【陆勤践行】数据科学家自我修养——一份数据科学的开放课程清单

数据科学家自我修养——一份数据科学的开放课程清单 最近一年以来,大数据这个概念被吹嘘的天花乱坠,仿佛你要是不说大数据就落伍了。继云计算之后,大数据已然成为IT行...

2158
来自专栏PPV课数据科学社区

一位美国TOP10统计专业本科生的经验:别走我这样的弯路

平日里,有四成以上的疑难提问来自于计量与统计,相信统计的学习和进阶也是所有经管专业的BABY们绕不过去的一道坎儿,若能以较高的水平精通一门以上的统计工具,对学习...

3078
来自专栏数据的力量

【研究方法】如何提高问卷调查的信度和效度?

4248

扫码关注云+社区

领取腾讯云代金券