这里有10本书,陪你欢度机器学习的清凉暑假 | 丰盛的传送门

学习栗 编译自 GitHub 量子位 出品 | 公众号 QbitAI

你的暑假可能还没到,但机器学习的假期书单已经提前出炉了。

想到假期还可以好好学习,是不是一下子就有动力复习了呢?

必备解暑神器

1. Python Data Science Handbook

作者 Jake VanderPlas

这本书介绍了一些核心库,用Python处理数据的时候,就能感受到它们的珍贵。

具体来说,就是IPython, Numpy, Pandas, Matplotlib, Scikit-Learn,以及相关的软件包。

啃食此书之前,需熟悉Python语言。如需要这门语言的迅速入门之径,请选用A Whirlwind Tour of Python (Python旋风之旅) 。而这也不是小白友好的选择,只是为计算机相关研究人员准备的快速入门。

传送门: https://jakevdp.github.io/PythonDataScienceHandbook/

2. Neural Networks and Deep Learning

作者 Michael Nielsen

这本在线书,分为两个部分——

· 神经网络,一种唯美的、从万物生长中汲取灵感的编程范式,让计算机能够从数据中学习。

· 深度学习,一系列强有力的技术,让神经网络壮大起来。

神经网络加深度学习,可以给许多问题找到更好的解决方案,在图像识别、语音识别以及自然语言处理中,皆有用武之地。

此书涵盖的是,大量的核心概念。

传送门: http://neuralnetworksanddeeplearning.com/

3. Think Bayes

作者 Allen B.Downey

这本书讲的是,怎样用计算方法处理贝叶斯统计

作为Think X系列的一员,此书的思路是,如果你会编程,就可以用这项技能来学习其他科目了。

大多数讲贝叶斯统计的书,用的都是数学符号,也是以数学概念为脉络走的。

此书则用Python代码代替数学符号,用离散近似代替连续数学。

于是,数学里的积分变成了求和,概率分布的运算大多成了简单的环。

中文版已出版,资源自寻,以下为英文版地址。

传送门: http://greenteapress.com/wp/think-bayes/

4. Machine Learning & Big Data

作者 Kareem Alkaseer

这是一部没有完成的作品,随着时间推移内容也慢慢丰盈。

背后的想法是,在理论和实践之间获得平衡,让软件工程师可以轻松使用模型,又不用太依赖库。

大多数情况下,模型背后的概念或技术都比较简单直观,但是细节术语上就容易出问题。

另外,现有的库通常都可以解决手边的问题。但它们大多还是有自己的抽象方法和结构,把基本概念藏在背后了。

这本书的存在,就是想要把那些隐藏的概念厘清。

传送门: http://www.kareemalkaseer.com/books/ml

5. Statistical Learning with Sparsity: The Lasso and Generalizations

作者 Trevor Hastie, Robert Tibshirani, Martin Wainwright

在过去的十年里,计算和信息技术呈现爆炸式增长。随之,医疗、生物、金融、时常等等领域都有了大大大量的数据。

这部作品,在一个通用的概念框架之下,描述了一些统计学和数据科学的重要观点。

传送门: https://web.stanford.edu/~hastie/StatLearnSparsity/

6. Statistical inference for data science

作者 Brian Caffo

本书是Coursera课程Statistical Inference (推论统计学) 的配套书,也是Data Science专项课程的一部分。

不过,就算不上课,也可以学这本书。Coursera课程视频可以在油管上找到,搭配食用疗效更佳。

此书是推论统计学的入门之书,面向的主要是有编程能力的学生,帮他们把这样的能力用到数据科学或者统计学中。

传送门: https://leanpub.com/LittleInferenceBook/read

7. Convex Optimization

作者 Stephen Boyd, Lieven Vandenberghe

凸优化,是一类特殊的数学优化问题,最小二乘法和线性规划也属于这个类别。

最小二乘法和线性规划问题拥有非常完善的理论,可以用编程来轻松解决。

而这本书要说的是,凸优化中包含了更宽广的一类问题,但也依然可以用编程碾压。

传送门: http://stanford.edu/~boyd/cvxbook/

8. Natural Language Processing with Python

作者 Steven Bird, Ewan Klein, Edward Loper

这是一本关于自然语言处理 (NLP) 的书,英语、汉语等人类使用的语言都是系统处理的对象。

与编程语言不同,自然语言在代代相传的过程中发生演变,很难用明确的规则来解析其中的含义。

不过,人类还是要让计算机去理解自然语言。这本书,是基于Python以及一个名为自然语言工具包 (NLTK) 的开源库,写成的。

英文版传送门: https://www.nltk.org/book/ 中文版传送门: https://blog.csdn.net/feng98ren/article/details/79400377

9. Automate the Boring Stuff with Python

作者 Al Sweigart

你有没有花好几个小时给文件重命名、或者更新表格里的几百个单元格的经历?

这么痛苦的重复工作,还是交给电脑比较好。

跟着这本书,可以学到怎样用Python写程序来代替你完成那些繁复的操作。

新手友好,无需经验

传送门: https://automatetheboringstuff.com/

10. Social Media Mining: An Introduction

作者 Reza Zafarani, Mohammad Ali Abbasi, Huan Liu

过去10年里,社交媒体的发展革新了人们互相交流的方式,以及各行各业开展业务的方式。

在社交媒体上,通过互动、分享以及内容消费,每个个体都在以前所未有的速度产生数据。

理解并处理这类新的数据,从而搜集可用的规律——这给跨学科研究、新算法以及工具的开发,带来了机遇和挑战。

此书整合了社交媒体、社交网络分析以及数据挖掘的相关内容,为学生、数据从业者和研究人员提供一个平台,来初步了解社交媒体挖掘,以及它潜在的可能性。

中文版已出版,资源自寻,以下为英文版地址。

传送门: http://dmml.asu.edu/smm/SMM.pdf

献给即将无法自拔的你

虽然,还有几十天才到暑假,不过放了假也要好好学习哟,毕竟开学之后还要补考嘛。

如果十本太少的话,可以前往以下地址,还有十本书供您继续沉迷: https://www.kdnuggets.com/2017/04/10-free-must-read-books-machine-learning-data-science.html

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2018-05-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏CDA数据分析师

R语言学习由浅入深路线图

对于初学R语言的人,最常见的方式是:遇到不会的地方,就跑到论坛上吼一嗓子,然后欣然or悲伤的离去,一直到遇到下一个问题再回来。当然,这不是最好的学习方式,最好的...

1895
来自专栏PPV课数据科学社区

【参阅】大数据告诉你,什么家庭能培养出高考“状元”

  什么什么?九成上的是普通幼儿园,七成念的是普通小学!九成没有上过课外辅导班,三成谈过恋爱!   亲,你看到的不是别的,是关于2015年高考状元的调查数据...

40014
来自专栏数据科学与人工智能

【统计学习】写给在学习统计的学弟学妹

在其他论坛看到一篇写如何学统计的文章,作者侃侃而谈,语言也不失幽默,更重要的是,平实的表述中却把很多读统计的童鞋共有的感受和疑问一同归纳总结了出来。楼主看过之后...

2099
来自专栏飞总聊IT

智能的本质(二)---图灵机,电脑,以及人脑

讨论智能的本质,图灵机是无法回避的问题。图灵在很早的时候就旗帜鲜明的表示了图灵机的模型就是智能的本质,而人脑无非只是这种模型或者类似这种模型的一个具体实现而已。...

3387
来自专栏大数据文摘

什么时候应该听取机器决定?

1535
来自专栏新智元

Swarm AI 精确预测超级碗最终比分,大逆转剧情难逃群集智能预测

【新智元导读】昨天美国超级碗的比赛戏剧性十足。但是,如果告诉你,一家 AI 公司的预测平台早在开赛前就已经成功地精确预测出了最后的比分,这是不是更令人震撼?这家...

34911
来自专栏钱塘大数据

【数据视觉盛宴】2017最美可视化作品欣赏

“信息之美奖”全名为“凯度信息之美奖”(The Kantar Information is Beautiful Awards),是为了嘉奖信息与数据可视化的优秀...

3703
来自专栏大数据挖掘DT机器学习

【案例】商业智能决策系统解决方案

1.商业智能系统的目标   商业智能系统是以业务流程管理系统采集的数据为基础,对原始的数据进行加工,给出有利于决策形成的结果,帮助人们正确地进行经营决策。   ...

3588
来自专栏大数据文摘

吴恩达更新了!深度学习系列课程第5课放出,全剧终

25212
来自专栏量子位

最强数据集集合:50个最佳机器学习公共数据集丨资源

外国自媒体mlmemoirs根据github、福布斯、CMU官网等信息,整理了一张50个最佳机器学习公共数据集的榜单,量子位为大家分享一下~

4976

扫码关注云+社区