【荐书】机器学习需要的数学知识和基础书籍推荐

【新智元导读】我们在《机器学习里,数学究竟多重要?》一文中提供了机器学习所需的数学知识和建议,对于初学者来说,并不需要先掌握大量的数学知识再开始做机器学习。学习最基本的线性代数和数理统计,然后在掌握更多技术和算法的过程中继续学习数学是很好的方法。那么,本文带来值得推荐的数学基础书籍。

“机器学习/深度学习并不需要很多数学基础!”也许你在不同的地方听过不少类似这样的说法。对于鼓励数学基础不好的同学入坑机器学习来说,这句话是挺不错的。不过,机器学习理论是与统计学、概率论、计算机科学、算法等方面交叉的领域,对这些技术有一个全面的数学理解对理解算法的内部工作机制、获取好的结果是有必要的。机器学习确实需要对一些数学领域有深入理解,缺乏必要的数学知识,很可能在更深入的学习中不断遇到挫折,甚至导致放弃。

机器学习需要的数学主要包括:

  1. 线性代数
  2. 概率论与数理统计
  3. 多元微积分
  4. 算法和复杂性优化
  5. 其他

那么,了解机器学习这样一个跨学科领域,需要多高的数学水平?答案是多方面的,取决于个人水平和兴趣。至于在机器学习中各方面的数学知识的重要性,可以用下面的图表表示:

机器学习中各数学主题的重要性

上图中,“线性代数”和“概率论与数理统计”占比达到60%,可见它们既是必要、也是十分重要的数学知识。下面针对这两个领域,推荐一些广受好评的书籍。

《线性代数导论》

Introduction to Linear Algebra (5th Ed.)

作者:Gilbert Strang

这本教材是Gilbert Strang教授在MIT讲授《线性代数》课程的指定教材(MIT OpenCourseWare提供公开课视频),也是被很多其他大学选用的经典教材。这本教材难度适中,讲解清晰,对许多核心概念的讨论也很透彻,在国内国外都广受好评。

Gilbert Strang 教授是美国享有盛誉的数学家,在有限元理论、变分法、小波分析及线性代数方面均有所建树。他对教育的贡献尤为卓著,包括所著有的七部经典数学教材和一部专著。 Strang 自1962年至今担任麻省理工大学教授,其所授课程《线性代数导论》、《计算科学与工程》均在 MIT开放课程软件(MIT OpenCourseWare)中收录,获得广泛好评。

虽然该书似乎仍没有正式的中文版出版(如果有了请告诉我们),不过可以对照视频讲解学习。学过的同学的建议是,一定要做课后习题。

线性代数及其应用

作者:David C. Lay

Lay 的《线性代数及其应用》同样是一本经典教材,中文版已出到第3版。除了讲解数学知识外,该书的特色是介绍一些有趣的应用,帮助学习者掌握线性代数基本概念和应用技巧,为后续课程的学习和工作实践奠定基础。

《统计学习方法》

作者:李航

李航老师的《统计学习方法》对于中国学习者来说也是非常熟悉的数学参考书。李航的研究方向包括信息检索、自然语言处理、统计机器学习及数据挖掘,这本书被用于部分高校文本数据挖掘、信息检索及自然语言处理等专业的教材。

《深度学习》(Deep Learning)

作者:Ian Goodfellow, Yoshua Bengio, Aaron Courville

这本“花书”的中文版发售没几天便要加印,被誉为深度学习“圣经”,可见其热门。三位作者都是深度学习领域的“大牛”,这本书也确实被公认写得很好,不少读者在中文版出版前勤勤恳恳地打印出开源译本来学习。

数学方面,《深度学习》的第2—4章非常详细地解释了深度学习中所需的线性代数、概率分布、数值计算等数学知识,值得认真研读。

深度学习2-4章目录

“荐书”是新智元的一个专题栏目,下回你想看到哪个领域的书籍推荐?你对这个栏目有什么建议?请留言告诉我们!

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2017-08-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专访 | 先声教育CTO秦龙:有限的算法与无限的新意

378110
来自专栏量子位

搞机器学习/AI有什么必备的数学基础?| 经验之谈+资源大全

雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今天是开学第一天!心里只有学习的量子位,发现Hacker News上又有高分话题,而且还跟学习有关...

42350
来自专栏数据科学与人工智能

【数据科学】数据科学能回答什么样的问题?

机器学习是数据科学的发动机。每种机器学习方法(也称为算法)获取数据,反复咀嚼,输出结果。机器学习算法负责数据科学里最难以解释又最有趣的部分。数学的魔法在此发生。...

28580
来自专栏大数据文摘

谷歌DeepMind AI再次完爆人类 读唇语正确率胜专家(附论文下载)

23450
来自专栏新智元

周志华Deep Forrest论文参与者答网友问,或6月1日开源

【新智元导读】新智元之前发布周志华老师的Deep Forrest论文引起了广泛关注和讨论。本文作者Ji Feng正是该论文的参与者,他在知乎上对这篇论文的评论做...

360100
来自专栏CDA数据分析师

统计︱P值-0.05就发表,不然就去死!

寄语:需要多少个统计学家,才能保证对于p值有至少50%的不满呢?根据曼荷莲学院统计学家George Cobb半开玩笑的估计,答案是两个...或者一个。 一、P值...

20060
来自专栏新智元

【资源】机器学习和神经网络实践:书籍及博客推介

【新智元导读】前几天我们向大家推荐了自学成为 Data Scientist 在线课程系列,很多人纷纷收藏和分享。今天新智元再针对数学,为大家介绍几本书和相关资料...

39080
来自专栏数据科学与人工智能

【数据科学】数据科学可以做什么

机器学习是数据科学的发动机。每种机器学习方法(也称为算法)获取数据,反复咀嚼,输出结果。机器学习算法负责数据科学里最难以解释又最有趣的部分。数学的魔法在此发生。...

299100
来自专栏机器之心

业界 | 从视频到语句,优必选获TRECVID 2017子任务冠军

399150
来自专栏人工智能头条

几种监督式学习算法的比较

12120

扫码关注云+社区

领取腾讯云代金券