问根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中
EN

Stack Overflow用户

提问于 2015-08-19 19:10:05

回答 3查看 136.1K关注 0票数 75

我有一个pandas dataframe，它根据两列(A和B)包含重复的值：

我希望删除重复项，并将最大值行保留在列C中。这将导致：

我想不出该怎么做。我是不是应该用drop_duplicates()或者别的什么？

python

pandas

dataframe

duplicates

回答 3

Stack Overflow用户

发布于 2018-05-07 16:24:35

只需使用pandas drop duplicates功能即可完成此操作

df.drop_duplicates(['A','B'],keep= 'last')

票数 46

Stack Overflow用户

发布于 2015-08-19 19:17:57

我觉得groupby应该行得通。

df.groupby(['A', 'B']).max()['C']

如果你需要一个数据帧回来，你可以链接重置索引调用。

df.groupby(['A', 'B']).max()['C'].reset_index()

票数 11

Stack Overflow用户

发布于 2017-12-05 21:47:41

您可以根据自己的需要使用drop_duplicates完成此操作

# initialisation
d = pd.DataFrame({'A' : [1,1,2,3,3], 'B' : [2,2,7,4,4],  'C' : [1,4,1,0,8]})

d = d.sort_values("C", ascending=False)
d = d.drop_duplicates(["A","B"])

如果获得相同的订单很重要

d = d.sort_index()

票数 5

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/32093829

复制

相似问题

问根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中
EN