首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >如何在DataFrame.drop_duplicates()调用中获取丢弃的重复列表?

如何在DataFrame.drop_duplicates()调用中获取丢弃的重复列表?
EN

Stack Overflow用户
提问于 2018-07-23 01:16:09
回答 1查看 116关注 0票数 0

我有一个Python DataFrame,里面有一些重复的项目。

有没有一种简单的(惯用的)方法来获得重复列表?

我知道drop_duplicates(),但它似乎不能返回被丢弃的内容。

我可以通过使用散列映射来统计出现的次数来开发一些东西,但我希望避免使用大量执行内置功能的自定义构建函数来膨胀我的代码。

EN

回答 1

Stack Overflow用户

发布于 2018-07-23 01:23:47

获取重复列表的一种方法是使用"duplicated“函数。它返回一个布尔值列表,指示元素是否重复。

举个例子:

代码语言:javascript
复制
from io  import StringIO
import pandas as pd

txt1 = StringIO("""card
Amex
Visa
Amex""")
monthly_df = pd.read_csv(txt1)

print(monthly_df.duplicated())

print(monthly_df[monthly_df.duplicated()])

此代码的输出为:

代码语言:javascript
复制
0    False
1    False
2     True
dtype: bool
   card
2  Amex

所以我认为你要找的这段代码是这样的:

代码语言:javascript
复制
monthly_df[monthly_df.duplicated()]
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/51467492

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档