df.loc[0,:] # 返回第一行(索引为默认的数字时,用法同df.iloc),但需要注意的是loc是按索引,iloc参数只接受数字参数
df.ix[[:5],["col1","col2"]] #...# 返回一个按列col进行分组的Groupby对象
df.groupby([col1,col2]) # 返回一个按多列进行分组的Groupby对象
df.groupby(col1)[col2].agg(...,col3], aggfunc={col2:max,col3:[ma,min]}) # 创建一个按列col1进行分组,计算col2的最大值和col3的最大值、最小值的数据透视表
df.groupby(col1....transform("sum") # 通常与groupby连用,避免索引更改
数据合并
df1.append(df2) # 将df2中的行添加到df1的尾部
df.concat([df1, df2],...axis=1,join='inner') # 将df2中的列添加到df1的尾部,值为空的对应行与对应列都不要
df1.join(df2.set_index(col1),on=col1,how='inner