专栏首页最佳机器学习入门级资源

最佳机器学习入门级资源

这是一篇非常难写的文章,同时我希望这篇文章对于入门学习的朋友是真正有价值、有帮助的。

起初,关于这个问题,我脑子其实是一片空白的。我在想图书馆里的书、课程资料、论文、书籍哪个更加适合推荐给机器学习领域的入门初学者。

期间,我很纠结应该减掉、增加哪些内容。我努力把自己置身于程序员和初学者之中,从他们的角度思考哪些资源最有利于他们学习“机器学习”。

我精心挑选最好的资源。如果你真的是一个初学者,并且极其希望在机器学习领域有所耕耘,希望你能从中找到一些对你有帮助的知识。我的建议是专注于一项资料,一本书或一个编程库,并反复阅读其中涵盖的知识、教程。选择一样,坚持下去,一旦你已经掌握透了,再换一本书,反复阅读这本书。让它融入你的知识储备。

编程库

我认为,对于一件事应该学到可以构成威胁为止,再开始小试身手。

这就是我学习编程的方法,我相信很多其他人也是这样学习的。了解你的局限性,充分利用你的优势。如果你知道如何编程,可以利用它来快速深入了解“机器学习”。在你开始操作之前,应该先进行大量的训练,学习数学相关知识。

找到一个编程库,阅读文档,按照教程,开始尝试。以下是最好的开源机器学习编程库。它们并非都适合在你的生产系统中使用,但它们是很好学习资源,你可以从中学习、探索、研究。

你可以从一个熟悉的语言库开始,然后转到其他更强大的编程库。如果你是一名优秀的程序员,相信你可以很容易地在各种语言之间切换。它们的逻辑是相同的,只是在语法和API上略有不同。

  • 用于统计计算的“R项目”(R Project):这是一个环境和lisp脚本类似的语言。所有你想做的统计资料将被提供给R,包括一些测绘。CRAN上的机器学习类(第三方机器学习软件包)代码由该领域的领先人物编写,以及任何你能想到的东西。如果你想快速研究和探索,那么必须学习“R项目”。因此,你也可以从学习“R项目”(R Project)开始。
  • WEKA:这是一个提供API的数据挖掘工作台,包含用于整个数据挖掘中所需的大量命令行,它也具有图形用户界面。可以用于准备数据,可视化探索,构建分类,回归和聚类模型,许多算法都内置在第三方插件中。如果您是大数据和机器学习的新手,请坚持使用WEKA并坚持一次学习一样东西。
  • Scikit Learn:基于NumPy和SciPy构建的Python中的机器学习。如果你是一个Python或Ruby程序员,这是你的图书馆。这是友好的,功能强大,并提供优秀的文件。如果你想尝试别的,橙色将是一个很好的选择。
  • Octave:如果你熟悉MatLab或者你是一个NumPy程序员寻找不同的东西,可以考虑Octave。这是一个像Matlab一样的数值计算环境,可以很容易地编写程序来解决线性和非线性问题,比如大多数机器学习算法的基础问题。如果你有工程背景,这可能是你开始的好地方。
  • BigML:也许你不想做任何编程。您可以完全不用编程就可以像WEKA一样驱动工具。您可以进一步使用BigML等服务,在Web上提供机器学习界面,您可以在浏览器中浏览构建模型。

选择一个更适合自己的平台,用它进行“机器学习”实际学习。不要仅停留于学习表面,还要实际操作哦!

视频课程

很多初学者都很喜欢通过视频进行初步学习。

我在YouTube和VideoLectures.Net上观看了很多“机器学习”相关视频。但是有些人只是简单的看看视频,这并不是一种高效的学习方法。我建议在观看视频的时候应该记笔记,也可以对照视频自己演练一遍。

坦白说,我所见过的大多数视频课程都不太适合初学者。这些视频实际上都包含了线性代数和概率论的相关知识。

在我看过的视频中,Andrew Ng在斯坦福大学的讲座视频,很适合推荐给初学者。

论文概述

如果你不习惯阅读、研究论文,第一次阅读论文时,你会发现字里行间的语言非常僵硬。一篇论文就像是教科书中截取的片段,但它描述了一些实际情况。如果想要开始学习“机器学习”,你可能会在其中发现一些有趣的论文。

我只列出了两篇重要的文章,因为阅读文章可能会让你失望。

初学者机器学习书籍

有很多机器学习书籍,但为初学者编写的书籍却很少。

什么是真的初学者?

最有可能的是,你来自另一个领域,但现在开始学习“机器学习”,那些领域可能是计算机科学,编程或统计学。即使如此,阅读大多数书籍都需要至少有线性代数和概率论的知识基础。

有一些书鼓励程序员从通过算法的基础部分开始,并指向工具和库,以便可以开始尝试。

最值得推荐的是 编程集体智能(Programming Collective Intelligence)黑客机器学习(Machine Learning for Hackers)数据挖掘(Data Mining):分别用于Python,R和Java的实用机器学习工具和技术。如果有疑问,请阅读这三本书中的任意一本!

机器学习初学者的书籍
  • 编程集体智能:构建智能Web 2.0应用程序(Programming Collective Intelligence: Building Smart Web 2.0 Applications):本书是为程序员编写的。这本书不侧重于理论,重在代码示例和实际的网络问题、解决方案。买它、读它、做练习。
  • 黑客机器学习(Machine Learning for Hackers):我推荐在阅读 编程集体智慧(上文)之后,再学习这本书。它也提供了实用的实例,但它更多关于数据分析,以及使用R。我真的很喜欢这本书!
  • 机器学习:一个算法的角度(Machine Learning: An Algorithmic Perspective):这本书就像编程集体智慧的更高级版本。它有类似的内容(让机器学习开始的程序员),但它包括数学和参考,以及在Python中的例子和片段。如果对这本书有兴趣,我建议学习编程集体智慧(Programming Collective Intelligence)后阅读。
  • 数据挖掘:实用机器学习工具和技术,第三版(Data Mining: Practical Machine Learning Tools and Techniques, Third Edition):我实际上是从这本书开始的,实际上它是第一版,大约是2000年。我是一个Java程序员,这本书和随书库WEKA为我提供了一个完美的环境,可以将我自己的算法作为插件来实现,并且通常练习机器学习和更广泛的数据挖掘过程。我强烈推荐这本书和这条路。
  • 机器学习(Machine Learning):这是一本很老的书,包括公式和大量的参考文献。也是一本教科书,但对于每种算法都有很好的解释。

虽然很多人都有在讨论、推荐一些很棒的机器学习教科书,但很多都不适合初学者。

更生层次的阅读

我深深地思考了这个问题,我也去看了其他人的清单。

为了完整起见,下面是网络上一些关于机器学习入门的大量资源清单。

本文的版权归 青蛙跳 所有,如需转载请联系作者。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 用于入门的最佳机器学习资源

    这是一个非常难写的文章,因为我希望它是真正有价值的。

    天空
  • 机器学习最佳入门学习资料汇总

    专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。 这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:...

    陆勤_数据人网
  • 机器学习入门资源

    这是我在开始学习机器学习的知识的时候,看到的一个比较不错的基础学习路径教程以及部分学习资源。

    流川枫
  • 【陆勤践行】机器学习最佳入门学习资料汇总

    这篇文章的确很难写,因为我希望它真正地对初学者有帮助。面前放着一张空白的纸,我坐下来问自己一个难题:面对一个对机器学习领域完全陌生的初学者,我该推荐哪些最适合的...

    陆勤_数据人网
  • 最全的机器学习入门资料

    可汗学院,是由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,主旨在于利用网络影片进行免费授课。

    猴子聊数据分析
  • 最全的机器学习入门资料

    可汗学院,是由孟加拉裔美国人萨尔曼·可汗创立的一家教育性非营利组织,主旨在于利用网络影片进行免费授课。

    猴子聊数据分析
  • 资源 | 最入门级别的机器学习图书:Chris Bishop发布在线新书

    选自MBML book 参与:蒋思源 PRML 大神、微软剑桥研究院院长 Chris Bishop 与 John Winn 的机器学习新书 Model Base...

    机器之心
  • 机器学习入门方法与资源整合分享

    近些天经常有小伙伴问到“机器学习如何入门,看哪些资料 ?”,于是乎想根据笔者学习两年多的学习经验,介绍下机器学习如何入门,该看哪些资料?下面我将从以下几个方面整...

    商业新知
  • 机器学习:从入门到晋级

    目前,人工智能(AI)非常热门,许多人都想一窥究竟。如果你对人工智能有所了解,但对机器学习(Machine Learning)的理解有很多的困...

    用户3578099
  • python机器学习入门资料梳理

    在python基本语法入门之后,就要准备选一个研究方向了。马上就要进行春季实习招聘了,加油!总结一下python机器学习方面的资料吧。 1、数据处理 1....

    机器学习AI算法工程
  • 11月最佳机器学习开源项目Top10!

    过去一个月,我们从近 250 个机器学习开源项目中挑选出了最受大家关注的前十名。这些项目在 GitHub 上平均 Stars 数为 2713。这些项目涉及由 G...

    磐创AI
  • 资源 |​ 史上最全机器学习笔记

    本文由LCatro整理 机器学习 机器学习算法原理 https://github.com/wepe/MachineLearning 机器学习实战原书内容与批注 ...

    AI科技大本营
  • 入门级攻略:机器学习 VS. 深度学习

    本文以浅显易懂的语言介绍了机器学习和深度学习的定义及应用,以及在源数据要求,硬件支持,特征工程、问题解决方式、执行时间及可解释性等方面的区别,对于新手入门有很大...

    华章科技
  • 资源 | 过去一年最热门的30个机器学习项目!

    因为这是从2017年1月至12月期间发布的最佳开源机器学习库、数据集和应用程序里精心挑选出来的。挑选的基数高达8800个。

    CDA数据分析师
  • 7月机器学习最佳开源项目Top 10

    【导读】七月就要结束了,在即将到来的 7 月最后一个周末,人工智能头条为大家整理了本月 ML 最受欢迎的十大开源项目。就算放假在家也可以知道大家现在都在学些什...

    IT派
  • 【机器学习】有趣的机器学习:最简明入门指南

    在听到人们谈论机器学习的时候,你是不是对它的涵义只有几个模糊的认识呢?你是不是已经厌倦了在和同事交谈时只能一直点头?让我们改变一下吧! 本指南的读者对象是所有对...

    陆勤_数据人网
  • 最强数据集集合:50个最佳机器学习公共数据集丨资源

    外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,量子位为大家分享一下~

    量子位
  • 《量子机器学习》作者 Peter Wittek 最新研究:高级量子资源可用于机器学习

    【新智元导读】《量子机器学习》作者 Peter Wittek 的最新研究发现,与近似概率推理的经典启发式算法相比,量子协议的最新结果直接应用于 Gibbs 抽样...

    新智元
  • 资料 | 机器学习入门书单及下载

    关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 获取方式:后台回复 “入门书单” M...

    昱良

扫码关注云+社区

领取腾讯云代金券