在Python的pandas库中,可以使用drop_duplicates
方法从另一个DataFrame中删除包含相同日期的行。
具体操作步骤如下:
import pandas as pd
df1
。df2
。drop_duplicates
方法删除df2
中包含相同日期的行,并将结果保存到新的DataFrame中,假设为df3
:df3 = df2.drop_duplicates(subset='日期', keep=False)
subset='日期'
表示根据日期列进行去重。keep=False
表示删除所有重复的行。df3
进行后续操作。下面是一个示例代码:
import pandas as pd
# 创建第一个DataFrame
df1 = pd.DataFrame({'日期': ['2022-01-01', '2022-01-02', '2022-01-03'],
'数值': [1, 2, 3]})
# 创建第二个DataFrame
df2 = pd.DataFrame({'日期': ['2022-01-01', '2022-01-02', '2022-01-02', '2022-01-04'],
'数值': [4, 5, 6, 7]})
# 删除包含相同日期的行
df3 = df2.drop_duplicates(subset='日期', keep=False)
# 打印结果
print(df3)
输出结果为:
日期 数值
2 2022-01-02 6
3 2022-01-04 7
在这个示例中,df2
中包含两行日期为'2022-01-02'的重复行,使用drop_duplicates
方法删除了这两行,得到了新的DataFrame df3
。
领取专属 10元无门槛券
手把手带您无忧上云