【周末荐书】Python数据科学指南:循序渐进的数据分析及机器学习工具书

周末荐书

今天推荐一本编排和内容都很不错的Python书籍——《Python数据科学指南》,英文书名叫《Python Data Science Handbook》。

因为没有中文版的出版,所以我们只介绍英文版的。

1、结构

这本书的编排结构非常好,一共分为5章,每章一个主题,每个主题对应一个Python的模块:

  • 第一章:介绍IPython和Jupyter的使用; 这两个模块提供了数据科学人员进行工作的Python计算环境。
  • 第二章:介绍Numpy的相关使用; numpy提供了对Python的密集数据进行高效存储的ndarray数组对象的操作。
  • 第三章:介绍数据处理和Pandas模块的使用; pandas提供了DataFrame对象用来高效的存储和操纵数据。
  • 第四章:介绍数据可视化和Matplotlib的使用; matplotlib提供了灵活的数据可视化功能。
  • 第五章:介绍机器学习和scikit-learn模块的使用; sklearn提供了已有机器学习算法的高效和简洁的Python实现。

基本上,这就是一个完整的数据科学的路线图了(向前还欠缺统计学和线性代数的部分,向后还欠缺深度学习的部分)。

首先使用科学计算工具搭建环境,学习基高效的数据结构,数据操作处理,数据可视化,最后进行机器学习实践。

对于想要系统地掌握Python数据分析或是数据挖掘的人来说,这个编排,无疑是很平缓的。

而且直接运用工具进行代码实操,对于数学基础薄弱的人来说,也能够很快地做出效果来,而不用纠结于数学概念而徘徊不前。

2、内容

内容上,基本上以小的知识点为主,一个解释然后一个代码演示,即使英文水平不好,看着代码也能理解其中的意思。

以sklearn模块的文本特征提取为例:

3、最后

实在对英文有障碍的同学,可以下载一个必应词典或者有道词典等能够进行划词翻译的翻译软件,借助它们,配合代码实操,基本上是能够理解书中介绍的知识点。

这本书的PDF电子版网络上都有,在此就不给出下载的链接的。

有心人,终不负…… 大家周日愉快!

最近会更新很频繁,大致的方向是Python相关的应用:Web开发、渗透测试、数据分析、机器学习等,大家有什么建议,欢迎留言。

原文发布于微信公众号 - 州的先生(zmister2016)

原文发表时间:2017-11-05

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Python小屋

Python使用wordcloud+pillow基于给定图像制作词云

大致思路:Python扩展库wordcloud可以用来制作词云,而pillow库提供了图像处理功能,代码结合二者创建了词云头像,其中把给定的图像作为参考,只保留...

2668
来自专栏生信技能树

Python 3 reference/cheat sheet

虽然我本人是perl党,但我还是推荐新手学习python: 本次我们讲师团队讲解了: 对FASTQ的操作 5,3段截掉几个碱基 序列长度分布统计 FASTQ 转...

3767
来自专栏NewbieWeb

像素差逐帧动画

首先这是个从来没有在生产环境中使用的技术,而且对于交互较简单的展示动画等,可以使用视频直接替换(虽然视频也有很多兼容性问题);

642
来自专栏Python小屋

Python使用matplotlib进行可视化时精确控制图例位置

在进行数据可视化或者科学计算可视化时,显示图例会显得很高大上,但是如果能够精确控制图例的显示位置,无疑会显得档次更高。 本文以matplotlib.pyplot...

2586
来自专栏前端知识分享

第156天:canvas(三)

​ translate方法接受两个参数。x 是左右偏移量,y 是上下偏移量,如右图所示。

621
来自专栏AI派

开篇词 | 如何轻松玩转Pandas呢?

在今日,Python 俨然已成为一门非常受欢迎的语言,在掌握了Python后,你是不是已经发现了 Python 非常有意思呢?

581
来自专栏WOLFRAM

可视化:标签、缩放和排除

1754
来自专栏陈满iOS

看图学算法(二)数据结构基本概念篇

过了一个星期,笔者花了整整几天时间学习的整理,下面是第二篇即数据结构基本概念篇。很辛苦,希望会对大家有一点帮助。另外,本文系列第一篇在这里:看图学算法(一)算法...

865
来自专栏进步博客

[译]响应式图像

自从2010年Ethan Marcotte开始讨论响应式网页设计,开发者和设计师们竞相寻求处理响应式图片的方法。这的确是一个棘手的问题 ,因为我们对同一个网站在...

842
来自专栏全栈数据化营销

数据分析:今日头条阅读量和评论量前1000名的文章内容和标题特征

先占个坑,先写个大概的内容,得空后再补充完整的。 之前花了不少时间采集了2017年1月1日到17年12月6日今日头条上阅读量和评论量前100的文章,具体数据如下...

2895

扫码关注云+社区