此教程适合有pandas基础的童鞋来看,很多知识点会一笔带过,不做详细解释
Pandas数据格式
Series
DataFrame:每个column就是一个Series
基础属性shape,index...(['k1','k2'], take_last=True)# 保留 k1和k2 组合的唯一值的行,take_last=True 保留最后一行
----
排序
索引排序
# 默认axis=0,按行索引对行进行排序...)
值排序
# 按值对Series进行排序,使用order(),默认空值会置于尾部
s = pd.Series([4, 6, np.nan, 2, np.nan])
s.order()
df.sort_values...(['race','sex'], inplace = True)
# 默认情况下,设置成索引的列会从DataFrame中移除
# drop=False将其保留下来
adult.set_index([...模糊筛选数据(类似SQL中的LIKE)
# 使用正则表达式进行模糊匹配,*匹配0或无限次,?