专栏首页Python攻城狮Python数据科学(九)- 使用Pandas绘制统计图表1.信息可视化

Python数据科学(九)- 使用Pandas绘制统计图表1.信息可视化

1.信息可视化

因为人对图像信息的解析效率比文字更高,所以可视化可以使数据更为直观,便于理解,使决策变得高效,所以信息可视化就显得尤为重要。

1.尝试做一个折线图

df.plot()方法的函数说明

  • DataFrame还可以用于对列进行灵活处理的选项
  • 用折线图对比各个指数的实时的开盘点位,并设置图像大小
df['open'].plot(kind='line', figsize=[5,5], legend=True, title='code')
# 如果需要加入折线,设置参数grid=True即可
df['open'].plot(kind='line', figsize=[10,5], legend=True, title='code', grid=True)

2.绘制移动平均线

  • 获取上证指数5.21日分笔历史数据
import tushare as ts
df = ts.get_tick_data('000001', date='2018-05-21')

返回值说明:

  • time:时间
  • price:成交价格
  • change:价格变动
  • volume:成交手
  • amount:成交金额(元)
  • type:买卖类型【买盘、卖盘、中性盘】
  • 绘制当日前20条数据成交金额变动折线图
df = df.head(200)
df['amount'].plot(kind='line', figsize=[15,3], legend=True, title='code', grid=True)
  • 绘制移动平均线 移动平均线,Moving Average,简称MA,MA是用统计分析的方法,将一定时期内的证券价格(指数)加以平均,并把不同时间的平均值连接起来,形成一根MA,用以观察证券价格变动趋势的一种技术指标。
DataFrame.rolling(*window*,*min_periods = None*,*center = False*,
                    *win_type = None*,*on = None*,*axis = 0*,*closed = None *)[[source]]

参数说明:

  • window:int或偏移量移动窗口的大小,这仅适用于日期时间类型的索引。
  • min_periods:int,默认无窗口中需要有最小数量的观测数据(否则结果为NA)。对于由偏移量指定的窗口,这将默认为1。
  • center:布尔值,默认为False将标签设置在窗口的中心。
  • win_type:字符串,默认无提供一个窗口类型。如果None,所有点均匀加权。
  • on:字符串,可选用于计算滚动窗口的DataFrame列,而不是索引
  • closed:字符串,默认无在'右','左','双'或'既非'端点上关闭间隔。
  • axis: 轴,int或字符串,默认为0
df['mvg2']=df['amount'].rolling(window=2).mean()
df[['amount', 'mvg2']].plot(kind='line',figsize=[10,5])

3.绘制直方图

  • 我们找出5.21号14:55 - 14:57 这两分钟内的上证指数数据,观察它的成交金额变化
df.ix[(df.time>='14:55:00')&(df.time<='14:57:00'),'amount'].plot(kind='bar', figsize=[10,5],  legend=True, title='amount')

4.绘制圆饼图

import tushare

# 获取大盘指数实时行情列表
df = ts.get_index()
df['diff'] = df['close'] - df['open']
df['rise'] = df['diff'] > 0  # 涨
df['fall'] = df['diff'] < 0  # 跌
# counterclock 布尔值,可选参数,默认为:None。指定指针方向,顺时针或者逆时针
# startangle浮点类型,可选参数,默认:None。如果不是None,从x轴逆时针旋转饼图的开始角度。
df[['rise', 'fall']].sum().plot(kind='pie', figsize=[5,5], counterclock=True, 
                                  startangle=90, legend=True, title='diff')

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Python数据科学(六)- 资料清理(Ⅰ)1.Pandas1.资料筛选2.侦测遗失值3.补齐遗失值

    成功爬取到我们所需要的数据以后,接下来应该做的是对资料进行清理和转换, 很多人遇到这种情况最自然地反应就是“写个脚本”,当然这也算是一个很好的解决方法,但是,p...

    意气相许的许
  • Python数据科学(八)- 资料探索与资料视觉化1.叙述性统计与推论性统计2.进行读取相关数据

    丘老师是使用pandas_datareader.DataReader来读取的雅虎提供的阿里巴巴股票数据,现在雅虎已经被弃用。这里我使用Tushare来读取金融数...

    意气相许的许
  • Python数据科学(七)- 资料清理(Ⅱ)1.资料转换2.处理时间格式资料3.重塑资料4.学习正则表达式5.实例处理

    注意:这里的时间转换后的格式可以根据需要设定,eg:dt.strftime('%Y/%m/%d')

    意气相许的许
  • 使用Pandas读取复杂Excel表单

    传统企业里,Excel仍然是数据存储,报表生成和数据分析的主力军,随着数据体量的增长,和数据分析、挖掘,BI更进一步需要,如何快速地使用Pandas来ETL E...

    Lenis
  • 机器学习项目:建立一个酒店推荐引擎

    所有在线旅行社都在争先恐后地满足亚马逊和网飞(Netflix)设定的AI驱动的个性化标准。此外,在线旅游已经成为一个竞争激烈的领域,品牌试图通过推荐,对比,匹配...

    AiTechYun
  • 使用pandas筛选出指定列值所对应的行

    该方法其实就是找出每一行中符合条件的真值(true value),如找出列A中所有值等于foo

    星星在线
  • 利用深度学习建立流失模型(附完整代码)

    失去一个老用户会带来巨大的损失,大概需要公司拉新10个新用户才能予以弥补。如何预测客户即将流失,让公司采取合适的挽回措施,是每个公司都要关注的重点问题。

    Python中文社区
  • Python 数据分析初阶

    这里可以单独查看其中的内容 data['nick'],计算其中的大小则使用 data['nick'].value_counts()。

    zucchiniy
  • 2 个数据处理的小功能,非常实用!

    0.25 版本开始支持 query 方法,可读性上又获得大幅提升,类似 sql 查询数据的写法,更加人性化。

    double
  • 十分钟掌握Pandas基本操作(上)

    为了更好地掌握数据科学必备库Pandas的基本使用,本文通过精灵宝可梦的数据集实战,我们一起过一遍Pandas的基本操作,文中的代码都附有注释,并给出了结果的配...

    老肥码码码

扫码关注云+社区

领取腾讯云代金券