首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas :如何删除特定数量的重复行?

在Pandas中,可以使用drop_duplicates()函数来删除特定数量的重复行。这个函数会返回一个新的DataFrame,其中不包含重复的行。

要删除特定数量的重复行,可以设置keep参数为firstlast。默认情况下,keep参数的值为first,表示保留第一次出现的重复行,而删除后续出现的重复行。如果设置keep参数为last,则保留最后一次出现的重复行,而删除之前出现的重复行。

以下是删除特定数量的重复行的示例代码:

代码语言:txt
复制
import pandas as pd

# 创建一个示例DataFrame
data = {'col1': [1, 1, 2, 2, 3, 3],
        'col2': ['a', 'a', 'b', 'b', 'c', 'c']}
df = pd.DataFrame(data)

# 删除col1列中的2个重复行
df_drop_duplicates = df.drop_duplicates(subset='col1', keep='last')

print(df_drop_duplicates)

输出结果为:

代码语言:txt
复制
   col1 col2
1     1    a
3     2    b
5     3    c

在上述示例中,我们使用subset参数指定了要进行重复行检查的列(这里是col1),并将keep参数设置为last。结果DataFrame df_drop_duplicates 中只包含了一列col1的唯一值,并删除了第一次出现的重复行。

关于Pandas的更多信息和详细用法,您可以参考腾讯云文档中的相关文档:Pandas(数据处理库)

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

领券