如何在pandas dataframe中查找重复项并打印它们

文章/答案/技术大牛

发布

1回答

python、pandas

我正在使用duplicated函数检查panadas数据帧中的重复行，该函数工作得很好。但是，我如何只打印出正确的项目的行内容呢？我正在寻找类似这样的东西： for row in duplicateCheck.keys(): print (row, duplicateCheck[row]) 它打印数据帧中重复的项目

浏览 69提问于2020-01-07得票数 0

回答已采纳

1回答

Pandas/Python，df.duplicated的if语句

python、pandas

有一个简单的代码，可以查找重复的行，并将它们打印出来。它在没有IF语句的情况下工作得很好，所以它总是打印： duplicated rows in the sheet : Columns: [IP,MAC,DNS,TEST,TEST2] Index: [] 我想添加一个IF语句，以便只有在找到重复的值时才打印出结果。否则打印“无重复” import pandas

浏览 9提问于2019-10-17得票数 0

回答已采纳

1回答

使用索引+行匹配从数据中删除重复项

python、pandas

我有两个pandas DataFrames，我想将它们连接在一起，这样就可以去掉重复的外部联接。我的问题是，.drop_duplicates()在查找重复项时忽略索引。如果索引是不同的，那么它就不应该是重复的。如果行索引和列是重复的，如何删除重复项？我唯一能想到的就是使用df.to_dict()，然后创建一个新的DataFrame (非常低效率)。更新：fro

浏览 3提问于2012-05-27得票数 0

回答已采纳

2回答

在pandas中保留NaNs的同时删除重复项

python、pandas

在使用drop_duplicates()方法时，我减少了重复项，但也将所有NaNs合并到一个条目中。如何在保留具有空项(如np.nan, None or '')的行的同时删除重复项？import pandas as pd df = pd.DataFrame({'col':['one','two',np.nan,np.nan,np.nan,'tw

浏览 1提问于2014-05-07得票数 20

4回答

如何迭代数据帧的唯一行的列值，在熊猫中有排序的数值索引和重复的数据？

python、pandas、dataframe、iteration

我有一个熊猫DataFrame，它有排序的数字索引和重复的数字索引，对于给定列中相同的索引值，列值是相同的。我想迭代给定列的值，以获得索引的唯一值。示例1 3 42 58 我希望迭代列a中的值，以查找索引- [3,5]中的唯一条目。当我使用默认的ind

浏览 0提问于2018-03-06得票数 1

回答已采纳

6回答

如何使用pandas查找重复名称？

python、group-by、pandas

我有一个包含名为name的列的pandas.DataFrame，其中包含字符串。我想要获取在该列中多次出现的名称的列表。我该怎么做？

浏览 5提问于2013-03-06得票数 21

回答已采纳

2回答

附加和处理重复

python-3.x、pandas

现在，我想添加更多的数据，通过使用DataFrame.append()来实现。将附加的数据包含新列和重复值。因此，我通过在追加后删除重复的值来清理。有更好的办法吗？目前，它运行得很好，但我害怕在大型DataFrames上重复搜索。day.year+3: float(some_data3), } appending_df = pd.DataFrame.from_dict

浏览 2提问于2021-02-16得票数 0

3回答

如何用vba在excel中查找列中的重复项，然后弹出一个消息框？

excel、vba

想要在excel中的列中查找重复项，并希望在找到1个重复项时弹出一个msgbox，如果找到多个重复项，则不应继续弹出消息。此外，如果我可以使用两个列单元格值，并一起使用它们来查找重复项，这也会很有帮助。in Column A") End If MsgBox

浏览 0提问于2019-07-26得票数 0

3回答

查找数组中的重复项，并使用javascript将其删除

javascript

如何在数组中查找重复项并使用javascript删除它们？

浏览 0提问于2010-09-13得票数 2

回答已采纳

1回答

在不同的地块中绘制多个熊猫自相关图

python、pandas、plot、autocorrelation

我有一个Pandas DataFrame，我想单独绘制value的自相关函数，category中的每一项。下面是我尝试过的，它将所有的自相关函数绘制在同一张图上。如何分别打印它们并控制打印大小？# Import librariesfrom pandas.plotting import autocorrelation_plot # Create DataFrame</

浏览 62提问于2021-02-10得票数 1

回答已采纳

1回答

DataFrame为空，需要其中的数据

python、pandas

我想在Excel中查找2行内的重复项。由以下部分组成： list_A list_B1 brown colour3 red red 我查看了pandas文档，并尝试了重复方法，但我就是不知道为什么它总是说"DataFrame是空的“。在运行代码时，我得到以下输出：空的DataFrame 列:列表A、列表B 索引：[] im

浏览 22提问于2019-09-01得票数 0

回答已采纳

2回答

如何在pandas数据帧中查找包含除NaN之外的所有唯一值的列名？

pandas、unique

我想要查找包含pandas数据框中除NaN以外的所有非重复项的列。x y zb 2 2 Bd 4 NaN NaN列"x“和"z”具有除NaN之外的非重复值，因此我希望将它们挑选出来并创建一个新的数据框。

浏览 16提问于2020-05-14得票数 1

回答已采纳

1回答

遍历Pandas* Dataframe检查不同索引处的逻辑条件*

pandas、dataframe、iteration

我正在尝试遍历一个pandas数据帧，并简单地检查重复项。如果存在重复的'ID‘字段，则比较重复项的'BeginTime’字段，并根据几次if/elif/else比较的结果分配一个新时间。我遇到的麻烦是，我不知道如何在数据帧的不同索引上比较'ID‘的逻辑条件。当我运行代码时，检查重复项的输出是正确的，但是我没有得到任何新的时间分配。这就是我目前所知道

浏览 16提问于2020-10-10得票数 0

2回答

我最终得到的是两个文件，它们具有相同的列标题，但列本身的数据不同。我以前几乎从来没有用过熊猫，除了一些小东西，所以我在这个领域的知识并不是很多。例如，在一个.csv文件中，产品包含信息的“代码”、“名称”、“url”、“大小”，而在另一个文件中，它包含“代码”、“价格”、“image1”、“image2”等等。如果file2中的代码与file1中的代码相同，那么将file2中的数据粘贴到file1中(或者直接创建一个新文件)的最佳方法是什么？我可能会使用数万种不同的产品

浏览 10提问于2019-02-01得票数 1

回答已采纳

2回答

设置变量

bash、unix

此代码查找重复的文件名，如果它们相同，则打印它们。但我需要能够删除它们并获得路径名。我正在阅读并查找基于md5sum的副本。但是，我可能还想删除重复项并打印文件路径。有什么建议吗？

浏览 2提问于2011-10-11得票数 0

3回答

C++：如何在vector<string>中检测重复并打印一份？

c++、duplicates、stdvector

我想知道如何在向量中找到重复的字符串并打印出字符串的一个副本。例如，如果我有<"cat"，"dog"，"dog"，" bird "，>，它将打印出cat，dog，bird。我已经对向量进行了排序，并使用adjacent_find函数遍历向量(因为我必须查找是否有重复的单词)。我的代码检测重复项，但它只打印出非

浏览 10提问于2013-01-28得票数 3

回答已采纳

2回答

如何在列中找到重复行，然后找出另一列中的两个单元格是否等于Python中Excel选项卡中的第三个单元格？

python、pandas、excel

我需要在"Name“列中找到所有重复的行(字符串值)，然后在Pandas (Python)的Excel选项卡中的Excel选项卡中，查找两个数字值是否等于第三个值的总和。这个工作表中有两个选项卡。例如，在下表中，"Name“列中有几个重复项。但是对于"Richard Madden“重复项，则在”value“表(-4000) + (-6000)中对应的值等于(-10000

浏览 0提问于2022-01-17得票数 0

回答已采纳

2回答

按字母顺序对查询单词进行排序，并从单个行中删除重复单词

python、pandas

我想从Pandas DataFrame的每一行中对给定查询的单词进行排序，然后从它们中删除重复的单词。如何在每一行上分别执行此任务，如:给定DataFrame：-------------2.resident evilSr.No | Query1. gears of

浏览 4提问于2016-08-03得票数 1

回答已采纳

2回答

如何管理跨多个数据集的查找

python、excel、pandas、time-complexity

我刚开始使用大数据，正在尝试将一些CSV查找复制到Pandas代码中。在较小的数据集上，我已经能够摆脱嵌套循环。CSV中的查找是这样的:它们遍历datasheet1中的所有行，匹配datasheet2中的两个字段，如果存在匹配，则设置数据表1的行值： IF( ),) 当我在Pandas中尝试这样做

浏览 1提问于2017-12-02得票数 2

1回答

时间戳排序

python、sorting、timestamp

48.0849 57.0220 55.8769 6.1289 811 -1 -1 D0F2 0F14 F8B1 FFE4 # 我必须按照时间戳的顺序对数据进行排序，然后删除重复的时间戳

浏览 2提问于2018-03-13得票数 0

点击加载更多