key')
当两个DataFrame没有相同的列索引时,我们可以指定链接的列:
#如果两个DataFrame的列名不同,可以分别指定
df3 = pd.DataFrame({'lkey':['b','b...要根据多个键进行合并,传入一组由列名组成的列表即可:
left = pd.DataFrame({'key1':['foo','foo','bar'],'key2':['one','two','one']...上面两个表有两列重复的列,如果只根据一列进行合并,则会多出一列重复列,重复列名的处理我们一般使用merge的suffixes属性,可以帮我们指定重复列合并后的列名:
pd.merge(left,right...移除重复数据,使用drop_duplicates方法,该方法默认判断全部列,不过我们也可以根据指定列进行去重.
data = pd.DataFrame({'k1':['one']*3 + ['two'...4.2 数据聚合操作
特定聚合函数
我们可以像之前一样使用一些特定的聚合函数,比如sum,mean等等,但是同时也可以使用自定义的聚合函数,只需将其传入agg方法中即可:
df = pd.DataFrame