我有一个Python DataFrame,里面有一些重复的项目。
有没有一种简单的(惯用的)方法来获得重复列表?
我知道drop_duplicates()
,但它似乎不能返回被丢弃的内容。
我可以通过使用散列映射来统计出现的次数来开发一些东西,但我希望避免使用大量执行内置功能的自定义构建函数来膨胀我的代码。
发布于 2018-07-23 01:23:47
获取重复列表的一种方法是使用"duplicated“函数。它返回一个布尔值列表,指示元素是否重复。
举个例子:
from io import StringIO
import pandas as pd
txt1 = StringIO("""card
Amex
Visa
Amex""")
monthly_df = pd.read_csv(txt1)
print(monthly_df.duplicated())
print(monthly_df[monthly_df.duplicated()])
此代码的输出为:
0 False
1 False
2 True
dtype: bool
card
2 Amex
所以我认为你要找的这段代码是这样的:
monthly_df[monthly_df.duplicated()]
https://stackoverflow.com/questions/51467492
复制相似问题