专栏首页听雨堂Pandas对行情数据的预处理

Pandas对行情数据的预处理

库里是过去抓取的行情数据,间隔6秒,每分钟8-10个数据不等,还有开盘前后的一些数据,用Pandas可以更加优雅地进行处理。

需要把当前时间设置为index

df=df.set_index('time') #设置时间为索引字段

但是还是字符串,需要改为datetime类型:

ii=[datetime.strptime(idx,'%Y-%m-%d %H:%M:%S') for idx in df['time']] #索引列
df['newc']=ii
df=df.set_index('newc')

这样就得到datetime类型的index了,要保留分钟的数据,有两个方法,重新采样或者分组。

重采样:

fz=df.resample('T')
pr=fz['price'].mean()
am=fz['amount'].max()

分组:

df=df.groupby(lambda x:x.minute).mean()

或者直接用字符串进行分组,同时对价格取平均值,对成交量取最大值:

df=df.groupby(lambda x:x[:16])
pr=df['price'].mean()
am=df['amount'].max()

对于分组/采样结果,还可以用ohlc方法,很酷:

对比起来,用时间索引重采样的方式,可能更加灵活。因为诸如1分钟、5分钟、10分钟、半小时等各种时间节点,可以快速表示无需复杂的代码。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 对广晟有色的数据分析

    从广晟有色的K线图,有一个直观的感觉,就是价格上涨和成交量增加是相关的,而下跌时成交量似乎并不明显,能否进行一个量化的描述呢? ? 1、不能用成交量,用成交量相...

    用户1075292
  • 无法取得ConnectionSettings的问题

    app.config为 <?xml version="1.0" encoding="utf-8" ?> <configuration>   <connectio...

    用户1075292
  • 地图坐标

    1、椭球面 地图坐标系由大地基准面和地图投影确定,大地基准面是利用特定椭球体对特定地区地球表面的逼近,因此每个国家或地区均有各自的大地基准面,我们通常称谓的...

    用户1075292
  • python数据预处理之将类别数据转换为数值的方法

    有时候不得不处理一些非数值类别的数据,嗯, 今天要说的就是面对这些数据该如何处理。

    学到老
  • 用python做时间序列预测五:时间序列缺失值处理

    程序员一一涤生
  • 数据分析之Pandas分组操作总结

    Pandas做分析数据,可以分为索引、分组、变形及合并四种操作。之前介绍过索引操作,现在接着对Pandas中的分组操作进行介绍:主要包含SAC含义、groupb...

    Datawhale
  • 周一不睡觉,也要把pandas groupy 肝完,你该这么学,No.8

    掉头发,有借口吧 不洗头,有借口吧 不洗袜子,有借口吧 不去看电影,有借口吧 不陪女朋友,有借口吧

    梦想橡皮擦
  • python | 读文件 | csv 、json、pickle、sql等

    来说下pandas用于读取的文件格式有那些吧,这些读取方法获取文件的速度超级快,很实用。

    努力在北京混出人样
  • 超火动态价格面积图:手把手教你!

    近日,公众号推出了一篇名为《超火动态排序图:代码不到40行,手把手教你!》的文章,反向十分强烈。各大公众号进行的了转载,知乎也是有400+的点赞。

    量化投资与机器学习微信公众号
  • [数据分析工具] Pandas 功能介绍(二)

    我们需要看第一季度的数据是怎样的,就需要使用条件过滤

    数据分析

扫码关注云+社区

领取腾讯云代金券