前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >pandas实现数据可视化

pandas实现数据可视化

作者头像
陆勤_数据人网
发布2019-06-05 14:46:58
7380
发布2019-06-05 14:46:58
举报
文章被收录于专栏:数据科学与人工智能

请思考:

1 为什么要数据可视化?

2 pandas如何实现数据可视化?

一 简介

我们常用Python语言的matplotlib库和seaborn库实现数据可视化。实际上,pandas基于其数据框结构也能够便捷地绘制出各种类型的图形,以实现数据可视化的目的。

二 导入数据集

我们采用titanic数据集。

代码

代码语言:javascript
复制
1import numpy as np
2import matplotlib.pyplot as plt
3import pandas as pd
4
5%matplotlib inline
6
7titanic_data = pd.read_csv('./data/titanic_train.csv')
8# 数据检视
9print(titanic_data.head())

三 直方图

使用hist()函数或者plot()函数并设置参数kind的值为'hist'。

实例1

代码

代码语言:javascript
复制
1titanic_data['age'].hist()

实例2

代码

代码语言:javascript
复制
1titanic_data['age'].plot(kind='hist', bins=20)

实例3

增加图形风格设置

代码

代码语言:javascript
复制
1import seaborn as sns
2sns.set_style('darkgrid')
3
4titanic_data['age'].hist(bins=20)

请思考:

直方图在什么时候使用?通过直方图可以发现什么?

四 直线图

使用line()函数。

实例1

代码

代码语言:javascript
复制
1titanic_data.plot.line(x='age', y='fare', figsize=(8, 6))

五散点图

使用scatter()函数。

实例1

代码

代码语言:javascript
复制
1titanic_data.plot.scatter(x='age', y='fare', figsize=(8, 6))

六盒箱图

代码

代码语言:javascript
复制
1titanic_data.plot.box(figsize=(10, 8))

七 核密度曲线图

使用kde()函数。

实例1

代码

代码语言:javascript
复制
1titanic_data['age'].plot.kde()

请思考:

如何绘制目标变量survived分布的可视化?

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-05-31,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数据科学与人工智能 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档