10本机器学习和数据科学必读书(附PDF下载)。
Python Data Science Handbook
作者:Jake VanderPlas
链接:
https://github.com/jakevdp/PythonDataScienceHandbook
这本书介绍了在Python中处理数据所需要的基本而重要的库,包括IPython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关的包。该书假定读者对Python语言有一定的了解。
Neural Networks and Deep Learning
作者:Michael Nielsen
链接:
http://neuralnetworksanddeeplearning.com/
这本书会告诉你:
神经网络是一种优美的仿生编程范例,它使得计算机能够通过观测数据进行学习。深度学习是一系列强大的技术, 以帮助实现在神经网络中学习。神经网络和深度学习目前是图像识别、语言识别和自然语言处理等领域的最佳方案。该书同时也会教你神经网络与深度学习的各种核心概念。
Think Bayes
作者:Allen B. Downey
链接:
http://greenteapress.com/wp/think-bayes/
介绍如何通过编程方法进行贝叶斯统计的书籍。这本书和其他Think X系列书籍的想法一样,他们认为只要你知道如何编程,那么你就可以通过这项技能来学习其他的课题。
Machine Learning & Big Data
作者:Kareem Alkaseer
链接:
http://www.kareemalkaseer.com/books/ml
这本书还没写完。这个项目的目的在于平衡软件工程师的理论与实践,使他们能轻松地运行机器学习模型而并不需要过分依赖各种各样的库。这本书将阐释这些基本概念。
Statistical Learning with Sparsity
The Lasso andGeneralizations
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright
链接:
https://web.stanford.edu/~hastie/StatLearnSparsity/
过去的十年里,计算和信息技术出现了爆炸性增长,同时出现了大量的源自不同领域的数据,例如医疗、生物、金融和市场营销。这本书将在一个通用的概念性框架下来讲解这些领域的重要思想。
Statistical inference for data science
作者:Brian Caffo
链接:
https://leanpub.com/LittleInferenceBook
这本书是Coursera数据科学项目(Data Science Specialization)中的统计推断(Statistical Inference)课程配套书籍。诣在提供一个成本低廉的统计推断入门。目标读者是有数学或计算机背景的并且希望在统计和数据科学领域中得以运用的学生。这本书在Github上以markdown文档的形式免费提供。
Convex Optimization
作者:Stephen Boyd,Lieven Vandenberghe
链接:
http://stanford.edu/~boyd/cvxbook/
这本书是关于凸优化的,即一类数学优化问题,包括最小二乘方和线性规划。众所周知,最小二乘方和线性规划是非常完整的理论,它们有着各式各样的应用,并且可以用数学的方法高效地得出解。这本书的中心即阐述更多的凸优化问题。
Natural Language Processing
with Python
作者:Steven Bird,Ewan Klein,Edward Loper
链接:
https://www.nltk.org/book/
这是一本关于自然语言处理的书。本书将会介绍计算机对自然语言各种形式的操作。这本书基于Python语言,并同时提供名叫Natural Language Toolkit的开放资源库。
Automate the Boring Stuff
with Python
作者:Al Sweigart
链接:
https://automatetheboringstuff.com/
这本书里,你会学习如何使用Python来编辑程序,来代替你做需要花几个小时的事情,并且你不需要有编程基础。当你很纯熟地掌握这些编程基础,你将能够使用Python编程毫不费力地实现许多有用并惊艳的自动化特技。
Social Media Mining: An Introduction
作者:Reza Zafarani, Mohammad Ali Abbasi and Huan Liu
链接:
http://dmml.asu.edu/smm/
这本书结合了社交媒体,社交网络分析和数据挖掘,帮助学生、从业者、研究员和项目经理快速、清晰地理解社交媒体挖掘的基础和未来的可能性。