最佳机器学习入门级资源

这是一篇非常难写的文章,同时我希望这篇文章对于入门学习的朋友是真正有价值、有帮助的。

起初,关于这个问题,我脑子其实是一片空白的。我在想图书馆里的书、课程资料、论文、书籍哪个更加适合推荐给机器学习领域的入门初学者。

期间,我很纠结应该减掉、增加哪些内容。我努力把自己置身于程序员和初学者之中,从他们的角度思考哪些资源最有利于他们学习“机器学习”。

我精心挑选最好的资源。如果你真的是一个初学者,并且极其希望在机器学习领域有所耕耘,希望你能从中找到一些对你有帮助的知识。我的建议是专注于一项资料,一本书或一个编程库,并反复阅读其中涵盖的知识、教程。选择一样,坚持下去,一旦你已经掌握透了,再换一本书,反复阅读这本书。让它融入你的知识储备。

编程库

我认为,对于一件事应该学到可以构成威胁为止,再开始小试身手。

这就是我学习编程的方法,我相信很多其他人也是这样学习的。了解你的局限性,充分利用你的优势。如果你知道如何编程,可以利用它来快速深入了解“机器学习”。在你开始操作之前,应该先进行大量的训练,学习数学相关知识。

找到一个编程库,阅读文档,按照教程,开始尝试。以下是最好的开源机器学习编程库。它们并非都适合在你的生产系统中使用,但它们是很好学习资源,你可以从中学习、探索、研究。

你可以从一个熟悉的语言库开始,然后转到其他更强大的编程库。如果你是一名优秀的程序员,相信你可以很容易地在各种语言之间切换。它们的逻辑是相同的,只是在语法和API上略有不同。

  • 用于统计计算的“R项目”(R Project):这是一个环境和lisp脚本类似的语言。所有你想做的统计资料将被提供给R,包括一些测绘。CRAN上的机器学习类(第三方机器学习软件包)代码由该领域的领先人物编写,以及任何你能想到的东西。如果你想快速研究和探索,那么必须学习“R项目”。因此,你也可以从学习“R项目”(R Project)开始。
  • WEKA:这是一个提供API的数据挖掘工作台,包含用于整个数据挖掘中所需的大量命令行,它也具有图形用户界面。可以用于准备数据,可视化探索,构建分类,回归和聚类模型,许多算法都内置在第三方插件中。如果您是大数据和机器学习的新手,请坚持使用WEKA并坚持一次学习一样东西。
  • Scikit Learn:基于NumPy和SciPy构建的Python中的机器学习。如果你是一个Python或Ruby程序员,这是你的图书馆。这是友好的,功能强大,并提供优秀的文件。如果你想尝试别的,橙色将是一个很好的选择。
  • Octave:如果你熟悉MatLab或者你是一个NumPy程序员寻找不同的东西,可以考虑Octave。这是一个像Matlab一样的数值计算环境,可以很容易地编写程序来解决线性和非线性问题,比如大多数机器学习算法的基础问题。如果你有工程背景,这可能是你开始的好地方。
  • BigML:也许你不想做任何编程。您可以完全不用编程就可以像WEKA一样驱动工具。您可以进一步使用BigML等服务,在Web上提供机器学习界面,您可以在浏览器中浏览构建模型。

选择一个更适合自己的平台,用它进行“机器学习”实际学习。不要仅停留于学习表面,还要实际操作哦!

视频课程

很多初学者都很喜欢通过视频进行初步学习。

我在YouTube和VideoLectures.Net上观看了很多“机器学习”相关视频。但是有些人只是简单的看看视频,这并不是一种高效的学习方法。我建议在观看视频的时候应该记笔记,也可以对照视频自己演练一遍。

坦白说,我所见过的大多数视频课程都不太适合初学者。这些视频实际上都包含了线性代数和概率论的相关知识。

在我看过的视频中,Andrew Ng在斯坦福大学的讲座视频,很适合推荐给初学者。

论文概述

如果你不习惯阅读、研究论文,第一次阅读论文时,你会发现字里行间的语言非常僵硬。一篇论文就像是教科书中截取的片段,但它描述了一些实际情况。如果想要开始学习“机器学习”,你可能会在其中发现一些有趣的论文。

我只列出了两篇重要的文章,因为阅读文章可能会让你失望。

初学者机器学习书籍

有很多机器学习书籍,但为初学者编写的书籍却很少。

什么是真的初学者?

最有可能的是,你来自另一个领域,但现在开始学习“机器学习”,那些领域可能是计算机科学,编程或统计学。即使如此,阅读大多数书籍都需要至少有线性代数和概率论的知识基础。

有一些书鼓励程序员从通过算法的基础部分开始,并指向工具和库,以便可以开始尝试。

最值得推荐的是 编程集体智能(Programming Collective Intelligence)黑客机器学习(Machine Learning for Hackers)数据挖掘(Data Mining):分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请阅读这三本书中的任意一本!

机器学习初学者的书籍
  • 编程集体智能:构建智能Web 2.0应用程序(Programming Collective Intelligence: Building Smart Web 2.0 Applications):本书是为程序员编写的。这本书不侧重于理论,重在代码示例和实际的网络问题、解决方案。买它、读它、做练习。
  • 黑客机器学习(Machine Learning for Hackers):我推荐在阅读 编程集体智慧(上文)之后,再学习这本书。它也提供了实用的实例,但它更多关于数据分析,以及使用R。我真的很喜欢这本书!
  • 机器学习:一个算法的角度(Machine Learning: An Algorithmic Perspective):这本书就像编程集体智慧的更高级版本。它有类似的内容(让机器学习开始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果对这本书有兴趣,我建议学习编程集体智慧(Programming Collective Intelligence)后阅读。
  • 数据挖掘:实用机器学习工具和技术,第三版(Data Mining: Practical Machine Learning Tools and Techniques, Third Edition):我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这条路。
  • 机器学习(Machine Learning):这是一本很老的书,包括公式和大量的参考文献。也是一本教科书,但对于每种算法都有很好的解释。

虽然很多人都有在讨论、推荐一些很棒的机器学习教科书,但很多都不适合初学者。

更生层次的阅读

我深深地思考了这个问题,我也去看了其他人的清单。

为了完整起见,下面是网络上一些关于机器学习入门的大量资源清单。

本文的版权归 青蛙跳 所有,如需转载请联系作者。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏人工智能头条

2015人工智能重大突破

1843
来自专栏算法+

音频识别算法思考与阶段性小结

主要是 回复 给我发邮件以及QQ上询问的朋友们的一些疑问和需求,这里稍作回复一下。

4261
来自专栏量子位

分享实录 | 第四范式程晓澄:机器学习在推荐系统中的应用

主讲人:程晓澄 | 第四范式资深算法科学家 屈鑫 整理编辑 量子位 出品 | 公众号 QbitAI 9月20日晚,量子位邀请到第四范式资深算法科学家程晓澄,他以...

3595
来自专栏华章科技

炮灰模型:女生如何选择追求者的数学模型?

上周我的一个朋友第N 次向女生表白遭到拒绝,作为好朋友的我除了同情之外觉得应该做点什么。之前一次聊天受到 菠菜 的启发,加上出于对数学的兴趣,我对女生“选择与拒...

873
来自专栏新智元

Deepmind“好奇心”强化学习新突破!改变奖励机制,让智能体不再“兜圈子”

强化学习是机器学习中最活跃的研究领域之一,在该领域的研究环境下,人工智能体(agent)做到正确的事情时会获得积极的奖励,否则获得负面的奖励。

1573
来自专栏互联网数据官iCDO

用数据讲故事的诀窍 ——创建有说服力图表的5个步骤

用数据说话是当今社会的一个特别流行的词,它反映了当今人类面对这个信息爆炸时代所需要做出的必然的改变。 有预测截至2020年,整个数字世界的数据量将达到44ZB,...

4169
来自专栏顾宇的研习笔记

《如何高效学习》读书笔记

《如何高效学习》是斯科特·杨 总结自己学习经验和方法的一本手册。他用一年的时间自学完成了 MIT 公开课上正常情况下需要四年才能修完的计算机科学的 33 门课程...

2292
来自专栏AI科技评论

动态 | ACL 2018 首日:8 大 tutorial,深度强化学习最受关注

AI 科技评论按:继 2017 年的温哥华之旅后,ACL 2018 在澳大利亚墨尔本举办,举办地点为墨尔本会展中心,也是 IJCAI2017 举办地。

1443
来自专栏大数据文摘

炮灰模型:女生如何选择追求者的数学模型?

1832
来自专栏数据派THU

送你9个常用的人脸数据库(附链接、报告)

由FERET项目创建,此图像集包含大量的人脸图像,并且每幅图中均只有一个人脸。该集中,同一个人的照片有不同表情、光照、姿态和年龄的变化。包含1万多张多姿态和光照...

3.5K5

扫码关注云+社区

领取腾讯云代金券