在python的pandas中,合并数据共有三种思路。
其一,关系型数据库模式的连接操作。
其二,沿轴将多个操作对象拼接在一起。
其三,对互有重复数据的处理与合并。
我们分别来进行介绍。...image.png
这里,并没有指定要用哪个列进行连接,如果没有指定,就会默认将重叠列的列名当作连接键。这里连接的结果是按照笛卡儿积的逻辑实现的。在这个例子中表现不太明显,我们再看下一个例子。...import pandas as pd
from pandas import DataFrame
import numpy as np
df1 = DataFrame({'a' : [1, np.nan..., 5, np.nan],
'b' : [np.nan, 2, np.nan, 6],
'c' : range(2, 18, 4)})...df2 = DataFrame({'a' : [5, 4, np.nan, 3, 7],
'b' : [np.nan, 3, 4, 6, 8],})
print(