8分钟
resample
resample
方法:
Series/DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None,
label=None, convention='start', kind=None, loffset=None, limit=None,
base=0, on=None, level=None)
rule
:一个字符串,指定了重采样的目标频率axis
:为0/'index'
表示沿着0轴重采样;为1/'columns'
表示沿着1轴重采样closed
:一个字符串,指定降采样中,各时间段的哪一端是闭合的。如果为'right'
,则是左开右闭区间;如果为'left'
,则是左闭右开区间label
:在降采样中,如何设置聚合值的标签。可以为'right'/'left'
(面元的右边界或者左边界)。如:9:30~9:35
这5分钟会被标记为9:30
或者9:35
how
:用于产生聚合值的函数名或者数组函数。可以为'mean'/'ohlc'/np.max
等。默认为'mean'
,其他常用的有:'first'/'last'/'median'/'ohlc'/'max'/'min'
。how
被废弃了,而是采用.resample().mean()
这种方案。convention
:当重采样时期时,将低频转换到高频所采用的约定。可以为's'/'start'
(用第一个高频)或者'e'/'end'
(用最后一个高频)loffset
:一个timedelta
,用于调整面元(bin
)标签。如'-1s'
,会将用于将聚合的结果标签调早1秒,从而更容易表示它代表哪个区间。比如12:00:00
你就难以判别是哪个区间,而11:59:59
就很容易知道它是那个区间。
你也可以对调用结果对象使用
.shift()
方法来实现该目的,这样就不必设置loffset
了
base
:一个整数,默认为0.用于聚合过程中,当频率可以整除1D
(比如4H
)时,第一个完整的分组从哪个元素开始的。如rule='4H'
,base=2
,则Series[0:1]
作为一个分组,Series[2:6]....
作为一个分组....on
:一个字符串,对于DataFrame
,它指定了重采样的列。该列必须是datetime-like
level
:一个字符串或者整数。对于MultiIndex
,该参数指定了被重采样的子索引fill_method
:一个字符串,指定升采样时,如何插值。如'ffill'/'bfill'
。默认不插值
该参数被废弃。推荐使用
.resample().ffill()
这种方案。而limit
作为ffill()
的参数。
limit
:一个整数。指定向前或者向后填充时,运行连续填充的最大单元数量kind
:一个字符串,指定聚合到时间段Period
还是时间戳Timestamp
。默认聚合到时间序列的索引类型
学员评价