如何删除pandas dataframe中的重复行？

要删除pandas dataframe中的重复行，可以使用drop_duplicates()方法。该方法会返回一个新的dataframe，其中不包含重复行。

下面是完善且全面的答案：

在pandas中，可以使用drop_duplicates()方法来删除dataframe中的重复行。drop_duplicates()方法会返回一个新的dataframe，其中不包含重复行。

具体使用方法如下：

df.drop_duplicates()

该方法的参数可以控制删除重复行的方式。默认情况下，它会删除所有列值都相同的行，只保留第一次出现的行。如果想要保留最后一次出现的行，可以设置keep参数为'last'。

df.drop_duplicates(keep='last')

此外，还可以根据指定的列来判断是否为重复行。可以使用subset参数来指定需要考虑的列。

df.drop_duplicates(subset=['column1', 'column2'])

在删除重复行之前，可以先使用duplicated()方法来检查dataframe中是否存在重复行。duplicated()方法会返回一个布尔类型的series，表示每一行是否为重复行。

df.duplicated()

推荐的腾讯云相关产品：腾讯云数据库TencentDB，腾讯云数据仓库TencentDB for TDSQL，腾讯云数据备份TencentDB for Redis Backup。

腾讯云产品介绍链接地址：

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云