免费!数据科学必读书单

翻译 | 林椿眄

出品 | 人工智能头条(公众号IDS:AI_Thinker)

数据科学是一个跨学科的领域,它包含来自统计学、机器学习、贝叶斯等领域的方法和技术,旨在探索特定的数据结构和内容。在本文中,我们列出了一些优秀的数据科学书籍,这涵盖了数据科学领域的所有主题,而且可以免费查阅或下载。

1. Foundations of Data Science

链接: https://www.cs.cornell.edu/jeh/book2016June9.pdf 作者: Blum, Hopcroft and Kannan

这本数据科学书籍是现代数据科学理论课程内容的完美结合。

2. UFLDL Tutorial

链接: http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial 贡献者: Andrew Ng, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen

本教程旨在让你熟悉无监督特征学习和深度学习的主要思想。

3. Python Data Science Handbook

链接: https://github.com/jakevdp/PythonDataScienceHandbook 作者:Jake VanderPlas

本书介绍了 Python 中处理数据所必需的核心库:特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn 和相关软件包。

4. Hands-On Machine Learning and Big Data

链接: https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details 作者:Kareem Alkaseer

本书是学习机器学习和大数据概念的重要资源。

5. Think Stats

链接: http://greenteapress.com/thinkstats/ 作者:Allen B Downey

这本书可以教你使用简单的技术来探索现实中的数据集,并解答一些有趣的问题。这是数据科学领域最受推荐的书籍之一。

6. Think Bayes

链接: http://greenteapress.com/wp/think-bayes/ 作者:Allen B Downey

这本书通过一些计算方法介绍贝叶斯统计的知识。此外,本书使用 Python 代码而不是枯燥的数学知识,并通过一些离散近似而不是连续数学的知识来展示一些理论。

7. EE263: Introduction to Linear Dynamical Systems

链接:http://ee263.stanford.edu/ 作者:Reza Nasiri Mahalati

Sanjay 教授在这本书中强调将线性代数和线性动力学系统应用于电路、信号处理、通信和控制系统。

8. Convex Optimization — Boyd and Vandenberghe

链接: http://stanford.edu/~boyd/cvxbook/ 作者: Stephen Boyd and Lieven Vandenberghe

本书全面介绍了数值优化这个主题,并详细展示了如何高效地解决数值优化这类问题。

9. Essentials of Metaheuristics

链接: https://cs.gmu.edu/~sean/book/metaheuristics/ 作者:Sean Luke

这是一套关于元启发算法的讲座笔记,这个开放式讲座面向本科生、从业人员、程序员和其他非专业人士。

10. CIML

链接:https://ciml.info/ 作者:Hal Daumé III

CIML 是一套涵盖现代机器学习(监督学习、无监督学习、大量边际方法、概率建模、学习理论等)大部分内容的综述性材料。

作者:Shashank Gupta 原文链接: https://towardsdatascience.com/list-of-must-read-free-data-science-books-bfae4c5c5a16

原文发布于微信公众号 - 人工智能头条(AI_Thinker)

原文发表时间:2018-04-25

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【思维导图】机器学习基础之「统计篇」

本文用一系列「思维导图」由浅入深的总结了「统计学」领域的基础知识,是对之前系列文章做的一次完整的梳理,也是我至今为止所有与统计有关的学习笔记。众所周知,「统计学...

33960
来自专栏大数据挖掘DT机器学习

R语音与数据挖掘常用的包

本文分为6个部分,分别介绍初级入门,高级入门,绘图与可视化,计量经济学,时间序列分析,金融等。 1初级入门 《R语言实战》,这是高涛、肖楠等翻译的一本书详细全面...

45780
来自专栏人工智能

什么时候强化学习未必好用?

作者 Jason Xie 编译 Erica Yi 编辑 Emily 强化学习(reinforcement learning)描述的是个体(agent)必须...

26480
来自专栏AI科技大本营的专栏

CCAI | 如何能既便宜又快速地获取大数据?这位微软研究员设计了两个模型,帮你省钱省时间

美国微软雷德蒙研究院首席研究员周登勇 文/CSDN贾维娣 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 ...

33860
来自专栏大数据文摘

暑期追剧学AI | 油管网红带你搞定机器学习中数学思维(一)

21770
来自专栏AI科技评论

学界 | 滴滴 KDD 2018 论文详解:基于强化学习技术的智能派单模型

国际数据挖掘领域的顶级会议 KDD 2018 在伦敦举行,今年 KDD 吸引了全球范围内共 1480 篇论文投递,共收录 293 篇,录取率不足 20%。其中滴...

28620
来自专栏CSDN技术头条

如何能既便宜又快速地获取大数据?

美国微软雷德蒙研究院首席研究员周登勇 7 月 22 - 23 日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,C...

29280
来自专栏新智元

周志华Deep Forrest论文参与者答网友问,或6月1日开源

【新智元导读】新智元之前发布周志华老师的Deep Forrest论文引起了广泛关注和讨论。本文作者Ji Feng正是该论文的参与者,他在知乎上对这篇论文的评论做...

359100
来自专栏媒矿工厂

视频编码优化之道

5月20号,在LiveVideoStack音视频技术社区举办的WebRTCon 2018大会上,上海交通大学图像所宋利教授在WebRTC与Codec专题作为出品...

51720
来自专栏人工智能头条

家里有两只猫给挖坑,还有世界美食的诱惑,我就被无监督学习彻底收服了!

【导读】无监督学习是推断描述“未标记”数据的分布与关系的机器学习任务,即给予学习算法的示例是未被标记的,因此没有直接的方法来评估算法产生的准确性。无监督学习根据...

7120

扫码关注云+社区

领取腾讯云代金券