pandas 使用指南

8分钟

resample

resample方法：

  Series/DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, 
  label=None, convention='start', kind=None, loffset=None, limit=None, 
  base=0, on=None, level=None)

rule：一个字符串，指定了重采样的目标频率
axis：为0/'index'表示沿着0轴重采样；为1/'columns'表示沿着1轴重采样
closed：一个字符串，指定降采样中，各时间段的哪一端是闭合的。如果为'right'，则是左开右闭区间；如果为'left'，则是左闭右开区间
label：在降采样中，如何设置聚合值的标签。可以为'right'/'left'（面元的右边界或者左边界）。如：9:30~9:35这5分钟会被标记为9:30或者9:35
how：用于产生聚合值的函数名或者数组函数。可以为'mean'/'ohlc'/np.max等。默认为'mean'，其他常用的有：'first'/'last'/'median'/'ohlc'/'max'/'min'。 how被废弃了，而是采用.resample().mean()这种方案。
convention：当重采样时期时，将低频转换到高频所采用的约定。可以为's'/'start'（用第一个高频）或者'e'/'end'（用最后一个高频）
loffset：一个timedelta，用于调整面元（bin）标签。如'-1s'，会将用于将聚合的结果标签调早1秒，从而更容易表示它代表哪个区间。比如12:00:00你就难以判别是哪个区间，而11:59:59就很容易知道它是那个区间。

你也可以对调用结果对象使用.shift()方法来实现该目的，这样就不必设置loffset了

base：一个整数，默认为0.用于聚合过程中，当频率可以整除1D（比如4H）时，第一个完整的分组从哪个元素开始的。如rule='4H'，base=2，则Series[0:1]作为一个分组，Series[2:6]....作为一个分组....
on：一个字符串，对于DataFrame，它指定了重采样的列。该列必须是datetime-like
level：一个字符串或者整数。对于MultiIndex，该参数指定了被重采样的子索引
fill_method：一个字符串，指定升采样时，如何插值。如'ffill'/'bfill'。默认不插值

该参数被废弃。推荐使用.resample().ffill()这种方案。而limit作为ffill()的参数。

limit：一个整数。指定向前或者向后填充时，运行连续填充的最大单元数量
kind：一个字符串，指定聚合到时间段Period还是时间戳Timestamp。默认聚合到时间序列的索引类型

上一节: resampling 下一节: OHLC

直播支持申请

目录

评价

推荐

1. 基本数据结构

基本数据结构

Series

Index1

Index2

MultiIndex

DataFrame1

DataFrame2

2. 内部数据结构

Index

MultiIndex

Seris

DataFrame

3. 下标存取

[ ] 操作符1

[ ] 操作符2

loc/iloc/ix 存取器1

loc/iloc/ix 存取器2

at/iat 存取器1

at/iat 存取器2

query 方法

多级索引

整数 label

4. 运算

数值运算

排序1

排序2

统计1

统计2

5. 变换

索引和轴的变换1

索引和轴的变换2

合并数据1

合并数据2

索引旋转

6. 数据清洗

移除重复数据

apply1

apply2

缺失数据1

缺失数据2

离散化

7. 字符串操作

字符串操作

8. 聚合与分组

分组1

分组2

GroupBy对象1

GroupBy对象2

分组级运算

透视表和交叉表1

透视表和交叉表2

9. 时间序列

时间序列

Python 中的时间

时区

time 模块

datetime 模块1

datetime 模块2

时间点 Timestamp

DateOffset

Timedelta

时间段 Period

pands

.to_period(freq)

.asfreq()

DatetimeIndex

pandas.date_range()

Series

DatetimeIndex的方法

PeriodIndex

pandas.period_range()

PeriodIndex的方法

shift()

resampling

resample