专栏首页机器学习入门统计学习方法资源汇总

统计学习方法资源汇总

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u014688145/article/details/60758291

统计学习方法资源汇总

历时近半年《统计学习方法》的学习,今天告一段落。也没什么好说的,在学习过程遇到的一些坑,和搜集到的一些资料都在此汇总下,方便自己复习查阅。

统计学习方法总结

本书介绍了10种主要的统计学习方法:感知机、k邻近法、朴素贝叶斯、决策树、逻辑斯蒂回归与最大熵模型、支持向量机、提升发方法、EM算法、隐马尔可夫模型和条件随机场。这10中统计学习方法的特点概括总结在下表中。

建议学习顺序

1.k近邻法

所有方法中,最简单的模型,本质上并不算任何学习算法。参考博文有:

2. 决策树

决策树的核心在于对熵的理解,算法有ID3,C4.5,以及CART算法。参考的博文有:

3.感知机和支持向量机

这两部分都属于对几何空间的划分,可以放在一块学,支持向量机是感知机的升级版,该系列对数学的要求较高,是块难啃的骨头。参考博文有:

在总结之余,有一篇大神的博文高达56万的阅读量,可谓是SVM典型之作,强烈推荐。

4.朴素贝叶斯方法

深刻的贝叶斯原理,它的哲学绝对不是一行简单的贝叶斯公式所能描述的。参考博文有:

又发掘了一篇大神之作,现居美国研究心理学,从他口中叙述的贝叶斯令人印象深刻,强烈推荐。

5.逻辑斯蒂回归模型与最大熵模型

对熵有了一定的概念之后,以及了解了概率模型的极大似然估计方法后,便可以开始上述两个模型的学习了。参考博文有:

关于最大熵模型,可以参考吴军之作《数学之美》,深入浅出。

6. EM算法及隐马尔可夫模型

EM算法是解决含隐变量问题的迭代算法,是隐马尔可夫模型中Baum-Welch算法的一般形式,所以必须先学习EM算法,才能理解隐马尔可夫模型的学习算法。而隐马尔可夫模型则可归结为三个大问题:概率计算,参数学习,模型预测。参考的博文有:

关于EM算法的参考资料较多,可以直接参看上述博文的参考文献。

大神之作总是需要单独拎出来,说一下,讲的实在是太棒了。

7. 条件随机场

它是这本书的终极大boss,谁叫它放在了最后呢,它可谓是朴素贝叶斯、逻辑斯蒂回归、最大熵模型及隐马尔科夫模型的综合升级版。所以必须最后一个学,否则云里雾里。参考博文有:

那么这里就有一篇关于应用【概率模型】进行多元分类和序列标注的introduction,参考链接如下:

能帮助你理解书中所提到的【判别模型】和【生成模型】的区别。

8. 提升方法

指数损失函数的经典应用,三个臭皮匠顶个诸葛亮。参考博文有:

提升方法,引入了计算机学习理论PAC,发现了一位大牛,毕业于浙江大学,留美博士,链接如下:

机器学习牛博推荐

这一部分,推荐几位我认为在机器学习领域的大牛,呵呵,看着他们的博客长大,感觉自己差点变牛了,然而还差一大截,唉。

码农场: http://www.hankcs.com/ 他总结了《统计学习方法》中的所有章节,基本上是抄书,但是每个章节都有相应的代码,我博文中的代码基本上全来源于该博文,是开源项目NLP的作者,牛!

我爱自然语言处理 : http://www.52nlp.cn 里面有很多统计学中各种分布的知识,非常深刻有趣,大部分资源也可以从中找。

阮一峰的网络日志 : http://www.ruanyifeng.com/blog/ 上海财大经济学博士,非常博学,出版《ECMAScript 6入门》、《黑客与画家》、《软件随想录》等等。

CSDN July 大神:http://blog.csdn.net/v_july_v/article/details/7624837 七月在线的CEO,专注于机器学习的教学,看了他的SVM三重境界,变成了他的小粉。对算法也颇有研究,强烈推荐。

Free Mind : http://blog.pluskid.org/?p=772 浙大本科硕士,留美深造,数学功底强至令人折服,不怕虐可以看看。

刘未鹏 | Mind Hacks 思维改变生活 : http://mindhacks.cn/ 南大本科,现依旧在美国,所写文章深刻而哲学,喜欢研究认知心理学,但在机器学习领域也有深刻的认识,所谓知己知彼百战百胜,对如何学习有着自己独特的见解。

优化算法专栏:http://blog.csdn.net/column/details/optimization-a.html zouxy09的专栏:http://blog.csdn.net/zouxy09

未完待续

更新进行时…

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 算法细节系列(32):有趣的数学

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1147447
  • LeetCode Weekly Contest 25 之 507.Perfect Number

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1147447
  • POJ 刷题系列:1459. Power Network

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    用户1147447
  • 机器学习入门概览

    用户1737318
  • 机器学习入门概览

    我们从一个实例来了解机器学习的基本概念。假设我们现在面临这样一个任务(Task) ,任务的内容是识别手写体的数字。对于计算机而言,这些手写数字是一张张图片,如下...

    AI科技大本营
  • 初识机器学习

    机器学习解决的问题无非两类:预测、分类 预测:预测所属分类、预测预测数值,区别:预测目标Y是连续的还是离散的

    ZONGLYN
  • 观点 | 微软科学家谈机器学习的公平性问题:对性别和种族避而不谈并不是一个好方法

    AI 科技评论按:ACM Fellow、微软杰出科学家和管理总监 Jennifer T. Chayes 近日以 ACM 的名义发表了一篇文章,介绍了机器学习中的...

    AI科技评论
  • 第一章(1.3)机器学习概念图谱

    机器学习(machine learning)是最近非常火的一个领域,关于其一些基本定义百度百科、维基百科或者网上随便都可以找到很多资料,所以这里不做过多解释。

    两只橙
  • 第一章(1.3)机器学习概念图谱

    机器学习(machine learning)是最近非常火的一个领域,关于其一些基本定义百度百科、维基百科或者网上随便都可以找到很多资料,所以这里不做过多解释。

    两只橙
  • 当我们说数据挖掘的时候我们在说什么

    现在市面上谈论到的数据挖掘基本上都是基于统计学习的监督学习或非监督学习问题。尤其以监督学习应用面更广。

    华章科技

扫码关注云+社区

领取腾讯云代金券