的步骤如下:
import pandas as pd
data = {'日期时间': ['2022-01-01 08:00:00', '2022-01-02 08:00:00', '2022-01-02 08:00:00', '2022-01-03 08:00:00'],
'数值列': [1, 2, 3, 4]}
df = pd.DataFrame(data)
print("原始数据框df:")
print(df)
输出:
原始数据框df:
日期时间 数值列
0 2022-01-01 08:00:00 1
1 2022-01-02 08:00:00 2
2 2022-01-02 08:00:00 3
3 2022-01-03 08:00:00 4
df = df.drop_duplicates(subset='日期时间', keep='first')
print("处理后的数据框df:")
print(df)
输出:
处理后的数据框df:
日期时间 数值列
0 2022-01-01 08:00:00 1
1 2022-01-02 08:00:00 2
3 2022-01-03 08:00:00 4
以上代码会创建一个新的数据框df,保留1个重复的日期时间,但保留其他副本的行值。对于pandas库的具体概念、分类、优势、应用场景以及推荐的腾讯云相关产品和产品介绍链接地址等内容,请查阅腾讯云官方文档或其他相关资料。
领取专属 10元无门槛券
手把手带您无忧上云