专栏首页华章科技pandas创始人手把手教你利用Python进行数据分析(思维导图)

pandas创始人手把手教你利用Python进行数据分析(思维导图)

导读:Python是目前数据科学领域的王者语言,众多科学家、工程师、分析师都使用它来完成数据相关的工作。由于Python具有简单易学、语法灵活的特点,很多需要处理数据的人士想要学习,主要有两大类:
  • 财经类、统计类背景人员,他们的日常工作有大量数据需要处理、分析,但对于学习使用计算机领域的编程语言Python又感到无从下手。
  • 一些想要学习Python的计算机人员,他们工作较忙,没有太多时间通过互联网去系统学习Python数据技术

针对这两类人员的需求,近期出版上市的《利用Python进行数据分析》第2版是很好的选择。下面我们结合本书内容,大致介绍下如何利用Python进行数据分析。

01 Python数据分析流程及学习路径

数据分析的流程概括起来主要是:读写处理计算分析建模可视化四个部分。在不同的步骤中会用到不同的Python工具。每一步的主题也包含众多内容。

根据每个部分需要用到的工具,Python数据分析的学习路径如下:

02 利用Python读写数据

Python读写数据,主要包括以下内容:

我们以一小段代码来看:

可见,仅需简短的两三行代码即可实现Python读入EXCEL文件。

03 利用Python处理和计算数据

在第一步和第二步,我们主要使用的是Python的工具库NumPy和pandas。其中,NumPy主要用于矢量化的科学计算,pandas主要用于表型数据处理。

▲NumPy

▲pandas

04 利用Python分析建模

在分析和建模方面,本书主要介绍了Statsmdels和Scikit-learn两个库。

.Statsmodels允许用户浏览数据,估计统计模型和执行统计测试。可以为不同类型的数据和每个估算器提供广泛的描述性统计,统计测试,绘图函数和结果统计列表。

▲.Statsmodels

Scikit-leran则是著名的机器学习库,可以迅速使用各类机器学习算法。

▲Scikit-leran

05 利用Python数据可视化

数据可视化是数据工作中的一项重要内容,它可以辅助分析也可以展示结果。本书主要介绍了Python众多可视化库中最为主流的Matplotlib:

06 总结:为什么要选这本书

《利用Python进行数据分析》第2版原作者是美国的数据科学家Wes McKinney,他毕业于麻省理工学院,是大名鼎鼎的Python数据技术类库pandas的创始人,在多家投资银行从事过数据科学类的工作。本书第一版由Wes McKinney写于2010年,经过7年的技术发展,第一版中的部分技术已不再适用,因此他于2017年发表了本书的第二版,对书中的大量技术、代码、示例进行了更新。由于本书大受好评,国内旋即引进。

关于作者:徐敬一,是《利用Python进行数据分析》第2版的译者,中国工商银行的数据分析师,他在工作中大量使用各类Python数据技术,对于Python的数学科学技术栈十分了解,同时英语水平良好,使本书的翻译质量得以保证。

延伸阅读《利用Python进行数据分析》

转载请联系微信:togo-maruko

推荐语:适合刚学Python的数据分析师或刚学数据科学以及科学计算的Python编程者。阅读本书可以获得一份关于在Python下操作、处理、清洗、规整数据集的完整说明。

本文分享自微信公众号 - 大数据(hzdashuju),作者:徐敬一

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 数据科学大Battle,你站Python还是R

    导读:Python 或 R,这是一个问题。在数据科学工作中,你可能也经常遇到这个选择困难问题。本文作者Brian Ray基于数十年的Python和R在数据科学领...

    华章科技
  • Python程序员跳槽薪资报告:人生苦短,你们还好吗?

    导读:「人生苦短,我用Python」,这话曾是不少选择投入Python麾下的「码农」们的一句调侃和自我标榜。

    华章科技
  • 因为Python的这3个优点,我的薪资涨了一倍

    如果你对数据分析有所了解,一定听说过一些亲民的工具如Excel、Tableau、PowerBI等,都能成为数据分析的得力助手。但它们的不足也是显而易见的:操作繁...

    华章科技
  • Python 3.8 带来了哪些新鲜功能?

    Python 3.8最明显的变化就是赋值表达式,即:=操作符。赋值表达式可以讲一个值赋给一个变量,即使变量不存在也可以。它可以用在表达式中,无需作为单独的语句出...

    Python猫
  • GitHub 上适合新手的开源项目——Python 篇

    随着 Python 语言的流行,越来越多的人加入到了 Python 的大家庭中。为什么这么多人学 Python ?我要喊出那句话了:“人生苦短,我用 Pytho...

    HelloGitHub
  • 同一个项目中让R和Python无缝工作的五种方法

    最近,我同时使用R和Python进行了更多的项目。对我而言,使用最佳工具来完成工作变得越来越重要,而不受单一语言的束缚。Python在某些方面做得最好,R在某些...

    deephub
  • R用于研究,Python用于生产

    原文:R is for Research, Python is for Production

    郭好奇同学
  • 0基础入门学习Python开发用什么软件好?

    俗话说:“工欲善其事,必先利其器”,对于初学者来说,想要学好Python,除了需要付出努力外,还需要一个顺手的兵器。一个好的IDE会帮助你方便地编写Python...

    python学习教程
  • 怎么学python入门?python新手学习路线

    python新手学习路线,Python入门应该了解一些基本的计算机编程术语。Python 是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,Pyt...

    python学习教程
  • 教女朋友学 Python 第 1 天:Python 简介

    既然要学习 Python,那总得先了解了解它是干啥的、它的发展历史、它有什么特点以及最最重要的,我们能用它干啥?这样才能在我们后续学习的过程中更好的利用好它,提...

    村雨遥

扫码关注云+社区

领取腾讯云代金券