专栏首页数据科学与人工智能【机器学习】如何更好地学习机器学习?

【机器学习】如何更好地学习机器学习?

Metacademy的创始人Colorado Reed发布过一篇名为“机器学习练级攻略”,文中回答了初学者经常问他的一个问题:如何才能更好地学习机器学习?这篇文章将总结Colorado的建议并分步讲解他文中的路线图。

如何更好地掌握机器学习

Colorado是伯克利大学的在读博士,同时也是Metacademy的创始人。Metacademy是一个优秀的开源平台,许多专业人员共同在这个平台上编写wiki文章。目前,这些文章主要围绕着机器学习和人工智能这两个主题。

在Colorado的建议中,更好地学习机器学习的方法就是不断的通过书本学习。他认为读书的目的就是让心中有书。

一个博士在读生给出这样的建议并不令人惊讶,以前本站可能还推荐过类似的建议。这个建议还可以,但我不认为适用每个人。如果你是个开发者,想实现机器学习的算法。下面列出的书籍是一个很好的参考,可以从中逐步学习。

机器学习路线图

他的关于机器学习的路线图分为5个级别,每个级别都对应一本书必须要掌握的书。这5个级别如下:

  • Level 0(新手):阅读《Data Smart: Using Data Science to Transform Information into Insight》。需要了解电子表格、和一些算法的高级数据流。
  • Level 1(学徒):阅读《Machine Learning with R》。学习在不同的情况下用R语言应用不同的机器学习算法。需要一点点基本的编程、线性代数、微积分和概率论知识。
  • Level 2(熟练工):阅读《Pattern Recognition and Machine Learning》。从数学角度理解机器学习算法的工作原理。理解并调试机器学习方法的输出结果,同时对机器学习的概念有更深的了解。需要有算法、较好的线性代数、一些向量积分、一些算法实现经验。
  • Level 3(大师):阅读《Probabilistic Graphical Models: Principles and Techniques》。深入了解一些高级主题,如凸优化、组合优化、概率论、微分几何,及其他数学知识。深入了解概率图模型,了解何时应该使用以及如何解释其输出结果。
  • Leval 4(宗师):随便去学吧,记得反馈社区。

Colorado针对每个级别中列出的书中章节阅读建议,并给出了建议去了解的相关顶级项目。

Colorado后来重新发布了一篇博客,其中对这个路线图做了一点修改。他移除了最后一个级别,并如下定义了新的级别:好奇者、新手、学徒、熟练工、大师。他说道,Level 0中的机器学习好奇者不应该阅读相关书籍,而是浏览观看与机器学习有关的顶级视频。

机器学习中被忽视的主题

Scott Locklin也阅读了Colorado的那篇博客,并从中受到了启发,写了一篇相应的文章,名为“机器学习中被忽视的想法”(文中有Boris Artzybasheff绘制的精美图片)。

Scott认为Colorado给出的建议并没有充分的介绍机器学习领域。他认为很少有书籍能做到这一点,不过他还是喜欢Peter Flach所著的《Machine Learning: The Art and Science of Algorithms that Make Sense of Data》这本书,因为书中也接触了一些隐晦的技术。

Scott列出了书本中过分忽视的内容。如下所示:

  • 实时学习:对流数据和大数据很重要,参见Vowpal Wabbit。
  • 强化学习:在机器人方面有过讨论,但很少在机器学习方面讨论。
  • “压缩”序列预测技术:压缩数据发现学习模式。参见CompLearn。
  • 面向时间序列的技术。
  • 一致性预测:为实时学习精确估计模型。
  • 噪声背景下的机器学习:如NLP和CV。
  • 特征工程:机器学习成功的关键。
  • 无监督和半监督学习。

这个列表很好的指出了机器学习中没有注意到的领域。

最后要说明的是,我自己也有一份关于机器学习的路线图。与Colorado一样,我的路线图仅限于分类/回归类型的监督机器学习,但还在完善中,需要进一步的调查和添加所有感兴趣的主题。与前面的“读这些书就可以了”不同,这个路线图将会给出详细的步骤。

本文分享自微信公众号 - 数据科学与人工智能(DS_AI_shujuren)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2015-09-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 【机器学习】机器学习温和指南

    摘要:机器学习与NLP专家、MonkeyLearn联合创始人&CEO Raúl Garreta面向初学者大体概括使用机器学习过程中的重要概念,应用程序和挑战,旨...

    陆勤_数据人网
  • 【经验】普通程序员如何转做人工智能

    小编邀请您,先思考: 1 您擅长那种编程语言? 2 您了解深度学习,机器学习和人工智能吗? 我曾经也只是一个只懂 ACM 竞赛相关算法的普通程序员,误打误撞接触...

    陆勤_数据人网
  • 【FinTech】Fintech机器学习,所有你必须知道的

    金融世界处理统计数据和定量数字,使其成为机器学习(ML)的完美领域。 这种工程科学已经应用于医疗,旅游,媒体和零售等不同领域。

    陆勤_数据人网
  • 讨论 | 你是否遇到过你完全不能理解的机器学习概念?

    俗话说:隔行如隔山。但就算同一座山,有的时候因为“山”太大,未能爬到顶峰的人往往很难一窥整座山的全貌。 这不,AI科技评论在Reddit的机器学习版块就发现了一...

    AI科技评论
  • 模型的独立学习方式

    针对一个给定的任务,通常采取的步骤是:准确一定非规模的数据集,这些数据要和真实数据集的分布一致;然后设定一个优化目标和方法;然后在训练集上训练模型。

    石晓文
  • 敲门算法:和你一起学李宏毅

    “Jupyter Notebook 是一款开放源代码的 Web 应用程序,可让我们创建并共享代码和文档。它提供了一个环境,你可以在其中记录代码,运行代码,查看结...

    Datawhale
  • 2000字总结3种项目和面试中常用的集成学习算法

    俗话说,“三个臭皮匠,顶个诸葛亮”,多个比较弱的人若能有一种方法集中利用他们的智慧,也可以达到比较好的效果,这就是集成学习的思想。

    double
  • 从单个示例学习计算任务,Amazon元学习让ML专才变通才

    在过去的十年中,深度学习系统在许多人工智能任务中已被证明非常成功,但是它们的应用范围很狭窄。例如,一个经过训练可以识别猫和狗的计算机视觉系统,仍将需要大量训练才...

    新智元
  • ICLR 2019 选集:聚焦样本受限问题

    上周(5/6/19),国际学习表征会议(ICLR)开幕了。在此,我想深入研究一些我认为有趣的ICLR论文,这些论文大多与我个人感兴趣的领域有关(无监督学习、元学...

    AI研习社
  • 从 ICLR 2019 一览小样本学习最新进展!

    AI 科技评论按:通常而言,深度学习是典型的数据驱动型技术,面对数据有限的情况,传统的深度学习技术的性能往往不尽如人意。在本届 ICLR 上,许多研究者们利用元...

    AI科技评论

扫码关注云+社区

领取腾讯云代金券