df.reindex(index=[1101,1203,1206,2402],method='bfill')
数值上1205比1301更接近1206,因此用前者填充。...'ID':[1101,1104,1103,1106,1102]}).set_index('ID')
表中的值数据来自于df_temp, 而行索引和列索引则来自于传入的 df[0:5][['Weight'...(df[0:5][['Weight','Height']],method='bfill')
注意是用1105这个索引在df.temp中的前边或后边的值进行填充,
df_temp.reindex_like...df.drop_duplicates('Class',keep='last')
在传入多列时等价于将多列共同视作一个多级索引,比较重复项:
df.drop_duplicates(['School','Class...,这在抽样理论中很常见--本质上是以这一列的列值为权重
df.sample(n=3,weights=df['Math'].values).head()