pandas创始人手把手教你利用Python进行数据分析(思维导图)

导读:Python是目前数据科学领域的王者语言,众多科学家、工程师、分析师都使用它来完成数据相关的工作。由于Python具有简单易学、语法灵活的特点,很多需要处理数据的人士想要学习,主要有两大类:
  • 财经类、统计类背景人员,他们的日常工作有大量数据需要处理、分析,但对于学习使用计算机领域的编程语言Python又感到无从下手。
  • 一些想要学习Python的计算机人员,他们工作较忙,没有太多时间通过互联网去系统学习Python数据技术

针对这两类人员的需求,近期出版上市的《利用Python进行数据分析》第2版是很好的选择。下面我们结合本书内容,大致介绍下如何利用Python进行数据分析。

01 Python数据分析流程及学习路径

数据分析的流程概括起来主要是:读写处理计算分析建模可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。

根据每个部分需要用到的工具,Python数据分析的学习路径如下:

02 利用Python读写数据

Python读写数据,主要包括以下内容:

我们以一小段代码来看:

可见,仅需简短的两三行代码即可实现Python读入EXCEL文件。

03 利用Python处理和计算数据

在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。

▲NumPy

▲pandas

04 利用Python分析建模

在分析和建模方面,本书主要介绍了Statsmdels和Scikit-learn两个库。

.Statsmodels允许用户浏览数据,估计统计模型和执行统计测试。可以为不同类型的数据和每个估算器提供广泛的描述性统计,统计测试,绘图函数和结果统计列表。

▲.Statsmodels

Scikit-leran则是著名的机器学习库,可以迅速使用各类机器学习算法。

▲Scikit-leran

05 利用Python数据可视化

数据可视化是数据工作中的一项重要内容,它可以辅助分析也可以展示结果。本书主要介绍了Python众多可视化库中最为主流的Matplotlib:

06 总结:为什么要选这本书

《利用Python进行数据分析》第2版原作者是美国的数据科学家Wes McKinney,他毕业于麻省理工学院,是大名鼎鼎的Python数据技术类库pandas的创始人,在多家投资银行从事过数据科学类的工作。本书第一版由Wes McKinney写于2010年,经过7年的技术发展,第一版中的部分技术已不再适用,因此他于2017年发表了本书的第二版,对书中的大量技术、代码、示例进行了更新。由于本书大受好评,国内旋即引进。

关于作者:徐敬一,是《利用Python进行数据分析》第2版的译者,中国工商银行的数据分析师,他在工作中大量使用各类Python数据技术,对于Python的数学科学技术栈十分了解,同时英语水平良好,使本书的翻译质量得以保证。

延伸阅读《利用Python进行数据分析》

转载请联系微信:togo-maruko

推荐语:适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2018-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SDNLAB

NFV主导向开放平台的演进

近日,有调查显示网络功能虚拟化(NFV)和软件定义网络(SDN)平台是电信和网络设备供应商关注的重点,该调查同时表明网络正在向开放平台和开放的软件体系结构转变。...

3368
来自专栏Cloud Native - 产品级敏捷

微服务产品级敏捷: 重新定义软件设计

2016.11.1, 深圳, Ken Fang 不论你的产品是纯软件的,还是软、硬件相结合的,当你在版本中的软件设计,需要花费数个月,才能完成时,建议你应该深度...

18410
来自专栏全栈工程师成长之路

程序员最佳学习方法(干货总结)

2017
来自专栏企鹅号快讯

研究一下数据分析与挖掘的关系

我就在这里等你关注,不离不弃 ——A·May 数据分析和数据挖掘的区别到底在哪?这个问题还是要想清楚的,最开始,我以为用Python和R这种高级的编程软件做出来...

3305
来自专栏Java学习网

中级程序员还应该如何提高自己?

想法和问题 当程序员已经处于中级时,应如何提高自己?有很多关于“学习编程”的资源,能够让人从0到新手(虽然这些资源中大多数的质量是值得商榷的),但是怎么样才能...

2835
来自专栏企鹅号快讯

高精度人工智能搜索引擎Ella可通过关键词搜索抓取视频细节

“用指尖改变世界” ? 想要从安全监控摄像机拍摄的监控视频中搜索特定的车辆、物体、人物或事件的确是一项艰巨的任务,因为这需要耗费大量的时间和精力来扫描整个画面以...

2069
来自专栏ATYUN订阅号

谷歌采用神经网络驱动机器翻译,可离线翻译59种语言

谷歌的在线翻译自2016年以来一直由神经机器翻译(NMT)驱动,今天,该公司推出了其神经网络驱动的方法,以便谷歌翻译的iOS和安卓应用用户能够更准确地实现59种...

1162
来自专栏PPV课数据科学社区

机器学习编程语言之争,Python夺魁

随着科技的发展,拥有高容量、高速度和多样性的大数据已经成为当今时代的主题词。数据科学领域中所采用的机器学习编程语言大相径庭。究竟哪种语言最适合机器学习成为争论...

3945
来自专栏织云平台团队的专栏

青铜到王者:AIOps 平台在腾讯的升级之路

在海量运营方法论的指导下,运维团队构建了体系化的运维能力,为众多产品保驾护航。

4.3K11
来自专栏程序员互动联盟

【答疑释惑第十一讲】开发应用主要用什么语言?

疑惑一 开发应用主要用什么语言? 其实这个问题很多工作的,看到都觉得这个问的有点没有头绪,但是对于初学者来说还是希望更多的了解点这方面的,所谓应用开发就是处于底...

2865

扫码关注云+社区

领取腾讯云代金券