众所周知,数据科学的书籍从不缺乏,这些书本是帮助我们开始并在该领域建立职业生涯的有利工具。新年新气象,从读书开始!我们整理了最新书单,帮助您全面了解数据科学、R语言和Python,无论您是初学者还是大BOSS,接下来介绍的书籍,对您来说,都是很好的资源。
《R for Data Science》
作者:Hadley Wickham and Garrett
你在书中能学到什么?
·如何将数据集转换为便于分析的形式;
·学习R语言,以更清晰、更轻松地解决数据问题;
·学习检查数据,生成假设并快速测试它们;
·学习如何提供捕获数据集中的真实“信号”的低维度表示;
·学习R markdown以整合代码和结果;
·学习R studio和tidy verse等一系列R语言工具包。
《Practical Data Analysis: Second Edition》
作者:Hector Cuesta and Dr Sampath Kumar
你在书中能学到什么?
·学习如何获取可视化和格式化数据;
·学习构建图像相似性搜索引擎;
·学习如何生成大众能理解的有意义的可视化数据;
·学会分析社交网络图;
·学习安装数据分析工具,如Pandas, MongoDB和Apache Spark。
《Learning IPython for Interactive Computing and Data Visualisation》
作者:Cyrille Rossant
你在书中能学到什么?
·学习以交互方式加载和浏览数据集;
·学习使用Pandas有效执行复杂的数据操作;
·学习使用Numpy模拟数据模型;
·学习使用Scikit-image在Jupyter Notebook中以交互方式可视化和处理图像;
·学习使用Numba, Cython和IPython并行计算加速代码,并使用 HTML, JavaScript和 D3扩展笔记本界面。
《Data Mining And Analysis: Fundamental Concepts and Algorithms》
作者:Mohammed J. Zaki and Wagner Meira
你在书中能学到什么?
·学习数据挖掘和数据分析的基本算法,这些算法是大数据分析的基础,也是分析各种数据模式和模型自动化的方法;
·从算法的角度学习,将机器学习与统计学中的概念与大量示例和练习相结合。
《A Course in Machine Learning – Third Volume》
作者:Hal Daume
你在书中能学到什么?
·本书涵盖了现代机器学习的主要方面;
·学习决策树,学习限制,感知实践问题,而不仅是二进制分类,线性模型,神经网络,内核和集成方法;
·学习有监督学习、无监督学习、大边际分析、概率建模等方法。
《The First Encounter with Machine Learning》
作者:Max Welling
你在书中能学到什么?
·R & Data Mining是一套介绍性材料。涵盖了核心机器学习的主要方面。帮助你了解数据表示与处理、数据可视化、机器学习类型、最近邻分类算法;
·学习朴素贝叶斯分类器,朴素贝叶斯模型,新实例的分类预测,正则化;
·学习朴素贝叶斯分类器的监督学习方面。
《R and Data Mining 》
作者:Yangchang Ziao
你在书中能学到什么?
·本书适用于对R语言使用有一定经验的人群;
·本书提供了R语言中各种数据挖掘功能方面的示例和实际应用案例,能学习使用R语言进行数据挖掘,帮助您完成数据挖掘研究和项目。
《Fundamental Numerical Methods and Data Analysis》
作者:George W. Collins
你在书中能学到什么?
·本书介绍了关于线性方程和矩阵数值分析的基本概念;
·学习如何使用多项式逼近、插值和正交多项式,导数和积分的数值计算,微积分方程式的数值解;
·学习最小二乘法,傅立叶分析和相关数值逼近规范,概率论和统计学。本书还为您提供有关采样分布和数据分析统计测试的广义概念。
《Think Stats – Exploratory Data Analysis in Python》
作者: Allen Downey
你在书中能学到什么?
·本书介绍了如何使用Python语言编写程序,是Python初学者入门必备书籍;
·在整本书中通过案例研究的方式,帮助您了解整个数据分析过程-从收集数据和生成统计数据到识别模式和测试假设。在此过程中, 您将熟悉分布、概率规则、可视化以及许多其他工具和概念。
《Modelling With Data》
作者:Ben Klemens
你在书中能学到什么?
·学习数据库基本查询、使用查询、联接和子查询,数据库设计,将查询结果折叠到C代码中;
·学习线性投影主成分分析、多级建模概率和具有Python背景的统计学概念;
·学习文本处理、shell 脚本、一些脚本工具、正则表达式的知识。
本文作者:Martin F.R.
领取专属 10元无门槛券
私享最新 技术干货