我尝试在Python中组合两个CSV文件,每个CSV文件都有唯一的列,但这两个CSV文件共享一个公共键列。 我一直在寻找StackOverflow/Google/Pandas文档,但没有找到我想要的东西。Pandas文档页面上提供的merge和concat示例与我试图实现的不同,所以我不确定我所要求的在Pandas中是否可行。 我已经将两个CSV文件中的选定列读入到单独的数据帧中,现在我想要做的是基于键列将这两个数据帧合并为一个数据帧。 Example
CSV 1:
Key Make Model
501 Audi A3
502 Audi A4
503 Audi
我有两个数据格式如下:
DF1
A B C
1 2 3
4 5 6
7 8 9
DF2
Match Values
1 a,d
7 b,c
我想要将DF1'A‘与DF2' match’匹配起来,如果存在DF1‘A’值,则将DF2‘值’附加到DF1中。
So my result will be:
A B C Values
1 2 3 a,d
7 8 9 b,c
现在,我可以使用下面的代码来匹配这些值,但是它返回的是一个空的数据格式。
df1 = df1[df1[
如何从具有共同列值的两个数据帧中获得合并的数据帧,使得只有那些行使得合并的数据帧在特定的列中具有共同的值。
我有5000行df1格式:
director_name actor_1_name actor_2_name actor_3_name movie_title
0 James Cameron CCH Pounder Joel David Moore Wes Studi Avatar
1 Gore Verbinski Johnny Depp Orlando Bloom Jack Davenport Pirates
o
我有两个数据帧, df1 name value
A 1
B 2
A 3
D 4 df2 name class
A 1
B 3
E 4 试用过pd.merge(df1,df2,on='name',how='inner') im得到的输出是 name value class
A 1 1
A 3 1
B 2 3 我的预期输出是, name value
A 1
A 3
B 2