首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >Python:如何合并两个值不唯一的数据框

Python:如何合并两个值不唯一的数据框
EN

Stack Overflow用户
提问于 2018-08-12 01:07:47
回答 2查看 249关注 0票数 2

我有两个数据帧,

import pandas as pd
a = pd.DataFrame( { 'port':[1,1,0,1,0], 'cd':[1,2,3,2,1], 'date':["2014-02-26","2014-02-25","2014-02-26","2014-02-26","2014-02-25"] } )
b = pd.DataFrame( { 'port':[0,1,0,1,0], 'fac':[2,1,2,2,3], 'date': ["2014-02-25","2014-02-25","2014-02-26","2014-02-26","2014-02-27"] } )

我需要做的是获取每个日期-端口对,比如端口0和日期2014-02-25,在b中查找fac值,并将其填充到a中的新列中。因此,输出应如下所示

port cd date         fac 
1    1  "2014-02-26" 2
1    2  "2014-02-25" 1
... (so on) ...

我尝试只合并日期和端口上的帧,但得到了一个错误,我认为这是由于数据帧具有不同大小的事实--我有点不希望它无论如何都能工作。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2018-08-12 01:13:23

如果您希望合并这两个数据帧,则应使用merge

import pandas as pd
a = pd.DataFrame( { 'port':[1,1,0,1,0], 'cd':[1,2,3,2,1], 
         'date':["2014-02-26","2014-02-25","2014-02-26","2014-02-26","2014-02-25"]})

b = pd.DataFrame( { 'port':[0,1,0,1,0], 'fac':[2,1,2,2,3], 
         'date': ["2014-02-25","2014-02-25","2014-02-26","2014-02-26","2014-02-27"]})

df = a.merge(b)
print (df)

输出:

  port  cd  date       fac
0   1   1   2014-02-26  2
1   1   2   2014-02-26  2
2   1   2   2014-02-25  1
3   0   3   2014-02-26  2
4   0   1   2014-02-25  2
票数 2
EN

Stack Overflow用户

发布于 2018-08-12 01:17:47

我认为需要带mergedrop_duplicates

cols = ['port','date']
df = a.drop_duplicates(cols).merge(b, on=cols)
print (df)
   port  cd        date  fac
0     1   1  2014-02-26    2
1     1   2  2014-02-25    1
2     0   3  2014-02-26    2
3     0   1  2014-02-25    2

但是如果想要组合所有重复的对:

cols = ['port','date']
df1 = a.merge(b, on=cols)
print (df1)
   port  cd        date  fac
0     1   1  2014-02-26    2
1     1   2  2014-02-26    2
2     1   2  2014-02-25    1
3     0   3  2014-02-26    2
4     0   1  2014-02-25    2
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51801946

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档