课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
8分钟

resample

resample方法:

  Series/DataFrame.resample(rule, how=None, axis=0, fill_method=None, closed=None, 
  label=None, convention='start', kind=None, loffset=None, limit=None, 
  base=0, on=None, level=None)
  • rule:一个字符串,指定了重采样的目标频率
  • axis:为0/'index'表示沿着0轴重采样;为1/'columns'表示沿着1轴重采样
  • closed:一个字符串,指定降采样中,各时间段的哪一端是闭合的。如果为'right',则是左开右闭区间;如果为'left',则是左闭右开区间
  • label:在降采样中,如何设置聚合值的标签。可以为'right'/'left'(面元的右边界或者左边界)。如:9:30~9:35这5分钟会被标记为9:30或者9:35
  • how:用于产生聚合值的函数名或者数组函数。可以为'mean'/'ohlc'/np.max等。默认为'mean',其他常用的有:'first'/'last'/'median'/'ohlc'/'max'/'min'how被废弃了,而是采用.resample().mean()这种方案。
  • convention:当重采样时期时,将低频转换到高频所采用的约定。可以为's'/'start'(用第一个高频)或者'e'/'end'(用最后一个高频)
  • loffset:一个timedelta,用于调整面元(bin)标签。如'-1s',会将用于将聚合的结果标签调早1秒,从而更容易表示它代表哪个区间。比如12:00:00你就难以判别是哪个区间,而11:59:59就很容易知道它是那个区间。

你也可以对调用结果对象使用.shift()方法来实现该目的,这样就不必设置loffset

  • base:一个整数,默认为0.用于聚合过程中,当频率可以整除1D(比如4H)时,第一个完整的分组从哪个元素开始的。如rule='4H'base=2,则Series[0:1]作为一个分组,Series[2:6]....作为一个分组....
  • on:一个字符串,对于DataFrame,它指定了重采样的列。该列必须是datetime-like
  • level:一个字符串或者整数。对于MultiIndex,该参数指定了被重采样的子索引
  • fill_method:一个字符串,指定升采样时,如何插值。如'ffill'/'bfill'。默认不插值

该参数被废弃。推荐使用.resample().ffill()这种方案。而limit作为ffill()的参数。

  • limit:一个整数。指定向前或者向后填充时,运行连续填充的最大单元数量
  • kind:一个字符串,指定聚合到时间段Period还是时间戳Timestamp。默认聚合到时间序列的索引类型