前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Pandas进阶语法

Pandas进阶语法

作者头像
嘉美伯爵
发布2021-01-18 11:01:51
5470
发布2021-01-18 11:01:51
举报

注意

  • 取index多级索引:构造的时候是zip对,所以这样取
  • 取column多级索引:构造的时候是第一层和第一层数量一致,取的时候df.iloc[1:]把第一行去掉再去
  • pd.to_datetime()很重要,可以把str日期转化为datetime
  • 也可以这样取
  • ix

可以自适应loc iloc 但不建议用

apply 可赋值也可过滤

新增列直接 df['列名'] = data 就可以 删除列 df.remove('列名'),插入用appenf/insert

取列

  • set_index

这个方法很有用,可将columns转化为index

布尔索引

取行取列

  • loc:对index直接操作行操作
  • loc[:, column]:对列操作
  • iloc:对行号直接操作
  • iloc[:, column_index]:对列操作
  • iat:对单值进行操作
  • ./[]:对列进行操作

多层索引

  • 生成多级索引的方式
  • columns 多层索引

注意第一层的数量要和第二层的一致

  • index 多层索引

注意多层索引对应的分组

转换

  • stack/unstack unstack可以取消这种状态,便于分析
  • 归并

针对像省市县这样的数据,可以直接index和columns进行归并显示

  • 转时间戳
代码语言:javascript
复制
df['故障开始'] = pd.to_datetime(df['start_time'],unit='ms',origin=pd.Timestamp('1970-01-01 08:00:00'))

时间

  • 取每月
  • s/S 每个一秒
  • M 每隔一月
  • d/D 每隔一天
  • 过程

过滤

过滤原理,寻找为True的

timedelta可设置天(d),时(h),分钟(m),秒(s),ms,us

  • query
  • to_datetime

该方法可精确过滤时间

  • str

str具备Python str的所有方法,详细pandas中DataFrame字符串过滤之正则表达式

特殊

  • query

pandas query

大汇总

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-03-12,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 注意
  • 布尔索引
  • 取行取列
  • 多层索引
  • 转换
  • 时间
  • 过滤
  • 特殊
  • 大汇总
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档