翻译 | 林椿眄
出品 | 人工智能头条(公众号IDS:AI_Thinker)
数据科学是一个跨学科的领域,它包含来自统计学、机器学习、贝叶斯等领域的方法和技术,旨在探索特定的数据结构和内容。在本文中,我们列出了一些优秀的数据科学书籍,这涵盖了数据科学领域的所有主题,而且可以免费查阅或下载。
1. Foundations of Data Science
链接: https://www.cs.cornell.edu/jeh/book2016June9.pdf 作者: Blum, Hopcroft and Kannan
这本数据科学书籍是现代数据科学理论课程内容的完美结合。
2. UFLDL Tutorial
链接: http://deeplearning.stanford.edu/wiki/index.php/UFLDL_Tutorial 贡献者: Andrew Ng, Jiquan Ngiam, Chuan Yu Foo, Yifan Mai, Caroline Suen
本教程旨在让你熟悉无监督特征学习和深度学习的主要思想。
3. Python Data Science Handbook
链接: https://github.com/jakevdp/PythonDataScienceHandbook 作者:Jake VanderPlas
本书介绍了 Python 中处理数据所必需的核心库:特别是IPython,NumPy,Pandas,Matplotlib,Scikit-Learn 和相关软件包。
4. Hands-On Machine Learning and Big Data
链接: https://www.gitbook.com/book/kalkaseer/hands-on-ml-and-bigdata/details 作者:Kareem Alkaseer
本书是学习机器学习和大数据概念的重要资源。
5. Think Stats
链接: http://greenteapress.com/thinkstats/ 作者:Allen B Downey
这本书可以教你使用简单的技术来探索现实中的数据集,并解答一些有趣的问题。这是数据科学领域最受推荐的书籍之一。
6. Think Bayes
链接: http://greenteapress.com/wp/think-bayes/ 作者:Allen B Downey
这本书通过一些计算方法介绍贝叶斯统计的知识。此外,本书使用 Python 代码而不是枯燥的数学知识,并通过一些离散近似而不是连续数学的知识来展示一些理论。
7. EE263: Introduction to Linear Dynamical Systems
链接:http://ee263.stanford.edu/ 作者:Reza Nasiri Mahalati
Sanjay 教授在这本书中强调将线性代数和线性动力学系统应用于电路、信号处理、通信和控制系统。
8. Convex Optimization — Boyd and Vandenberghe
链接: http://stanford.edu/~boyd/cvxbook/ 作者: Stephen Boyd and Lieven Vandenberghe
本书全面介绍了数值优化这个主题,并详细展示了如何高效地解决数值优化这类问题。
9. Essentials of Metaheuristics
链接: https://cs.gmu.edu/~sean/book/metaheuristics/ 作者:Sean Luke
这是一套关于元启发算法的讲座笔记,这个开放式讲座面向本科生、从业人员、程序员和其他非专业人士。
10. CIML
链接:https://ciml.info/ 作者:Hal Daumé III
CIML 是一套涵盖现代机器学习(监督学习、无监督学习、大量边际方法、概率建模、学习理论等)大部分内容的综述性材料。
作者:Shashank Gupta 原文链接: https://towardsdatascience.com/list-of-must-read-free-data-science-books-bfae4c5c5a16