Pandas dataframe:保留具有重复项的行

文章/答案/技术大牛

发布

1回答

、、、

这个问题比Remove duplicate rows in pandas dataframe based on condition稍微复杂一点我现在有两个列'valu1'，‘valu2’，而不是一个01 3 122015-10-31 5 13 在上面的数据框中，我希望通过在valu1列中保留具有较高值的行，在value2列中保留较低值<e

浏览 95提问于2019-04-20得票数 3

回答已采纳

2回答

在pandas中保留NaNs的同时删除重复项

、

在使用drop_duplicates()方法时，我减少了重复项，但也将所有NaNs合并到一个条目中。如何在保留具有空项(如np.nan, None or '')的行的同时删除重复项？import pandas as pd df = pd.DataFrame({'col':['one','two',np

浏览 1提问于2014-05-07得票数 20

1回答

如何只保留重复行中的一条记录，且值基于另一列？

、、

我的pandas dataframe如下所示：现在您可以看到，除了最后一列Value之外，所有其他列都具有相同的ID和Order date，这表明这些行是重复的，我如何删除这些重复的行，并只保留一行具有highest value的行。注意：Dataframe非常大，有许多重

浏览 1提问于2021-11-03得票数 0

1回答

处理DataFrame中的行重复和删除Python中的最后一行以外的所有

、、、、

我很不幸地被Pandas数据清理困住了。我做了一个简单的例子来说明我的问题。对于每一行，我希望删除副本并保留最后一行。目前，我的DataFrame是“动物”。我希望它是DataFrame 'animals_clean‘ 想象一下这个DataFrame。您可以在axis=0上看到重复，例如，在第0行中重复“cat”。,['cow', &

浏览 2提问于2021-05-17得票数 0

回答已采纳

1回答

在特定列上添加来自其他数据帧的列，同时保留原始索引

、、、、

Pandas新手入门，并尝试基于两个数据帧共有的列从df2向df1添加列。我想保留df1中的索引。注意，df2有很多重复的行，包括重复的ItemIds。DataFrame 1 0 12 7DataFrame 2 0 1

浏览 9提问于2019-07-09得票数 0

回答已采纳

3回答

Python Pandas* -处理重复项*

、

我想处理pandas df中的重复项：df 我希望只保留具有唯一值A、B、C的

浏览 39提问于2017-12-14得票数 4

回答已采纳

1回答

Pandas Dataframe丢弃记录及其副本

我希望删除基于列的pandas Dataframe中具有重复项及其重复项的记录

浏览 18提问于2019-11-14得票数 0

回答已采纳

1回答

如何删除大熊猫数据中的重复数据记录

、、、

嗨，亲爱的，我是学习蟒蛇和熊猫的新手。我想用Python和Pandas删除数据中包含重复数据的重复数据记录。在dataframe中，我有两个列"code“和"number”。有几个重复行对“代码”具有相同的值，每个行对应一个数字。我只希望保留一个代码，并保存最大的相应数目。例如："a“有三个值:7、5和4。我希望它只

浏览 3提问于2020-06-17得票数 0

回答已采纳

2回答

随机丢弃重复

、

在Pandas中，我们可以使用dataframe.drop_duplicates()删除重复数据，默认情况下保留重复数据的第一行。如果是keep_last = True，则保留最后一行。我们如何保持随机行，并使用熊猫drop_duplicate删除重复行？

浏览 3提问于2014-04-04得票数 5

回答已采纳

3回答

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

、、、

我有一个pandas dataframe，它根据两列(A和B)包含重复的值：1 2 12 7 13 4 8 我希望删除重复项，并将最大值行保留在列C中。

浏览 162提问于2015-08-19得票数 75

回答已采纳

2回答

Python Pandas* Dataframe根据列值移除重复行*

、

我有一个pandas dataframe，如果LE列是"AAA“，我会尝试删除重复的行。如果有一个"AAA“，但没有其他行具有相同的ID/名称，那么我想不去管这些行。我所拥有的 df = pd.DataFrame({'ID': [111, 222, 222, 333, 333, 444, 444, 444,

浏览 3提问于2020-08-20得票数 1

1回答

如何将set函数应用于特定列的所有行，该列的条目是具有重复值的列表？

、

在我的pandas数据框中，我有一个列，该列的每一行都是一个具有重复值的列表。例如，一个有3行的数据框：df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想要删除重复项。我的预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用set函数来删除每个列表中<e

浏览 13提问于2020-08-03得票数 0

回答已采纳

3回答

群Pandas* DataFrame重复行，保留最后的索引*

、、

我有一个Pandas DataFrame，它有一个有意义的索引和各种重复行组。假设它看起来像这样： >>> df = pd.DataFrame([[1, 1, 1], [2, 3, 4], [2, 3, 4], [1, 1, 1](除了每个重复批处理中的第一个行)，但是将最后一行的索引保留

浏览 10提问于2021-10-26得票数 0

1回答

根据另一列的条件删除列中具有重复值的行- Python/Pandas

、、

我将CSV文件中的数据读入Pandas dataframe (所有单元格都具有字符串类型，NaN:s已被替换为“已经”)，有一些需要删除的重复值。rrrrr,fffB,rrr,fffffD,rrrrrrr,ffffE,rrrrr,fff我需要删除那些在Col1中具有重复值且= "") | ~my_df["Col1"].dupl

浏览 2提问于2022-11-03得票数 1

回答已采纳

1回答

根据特定列中前一行的值删除重复行

、、、

我有一个类似于以下示例的dataframe：data = pd.DataFrame(data={'col1': [1,2,3,4,5,6,7,8,9], 'col2': [1.55,1.55,1.55,1.8,1.9,1.9,1.9,2.1,2.1]}) 在第二列col2中，可以看到几个重复的值，3乘以1.55、3乘以1.9和2乘以2.1。我需要做的是删除与其上一行<em

浏览 4提问于2022-11-16得票数 0

回答已采纳

1回答

如何只保存副本？

、、、

我编写了代码从我的xlsx文件中的col中删除重复项。import pandas as pd data.to_excel(cielovy_subor, index=False) print("done") 它保存唯一

浏览 15提问于2020-12-10得票数 0

回答已采纳

1回答

如何在使用drop_duplicates (Pandas* DataFrame)时获得掉行？*

、、、

我使用pandas.DataFrame.drop_duplicates()删除所有列值相同的行的重复项，但是对于数据质量分析，我需要生成一个带有删除的重复行的DataFrame。如何识别要删除的行？我想到了比较原始的DF和没有重复的新的DF，并识别缺少的唯一

浏览 10提问于2020-07-06得票数 1

回答已采纳

2回答

在Dataframe中查找重复项，并返回与重复索引值相比的第一个索引值。

、、

我有一个具有重复字符串值但不同的索引，也就是ID值的dataframe。我试图找到字符串与扭曲重复的索引/ID值，以便将第一个索引/ID值与重复的行索引/ID进行比较。下面是输入数据的示例：data = [[1, 'online delivery, and now offer dedicated le

浏览 10提问于2022-09-16得票数 1

回答已采纳

1回答

将Dataframe转换为包含Pandas中数组的单元格的系列

、、、

我有一个带有列名的2D DataFrame，其中元素包含非空值和空值。我想将2D DataFrame‘夷为平地’为1D系列，在这里我只保留非空数据作为序列单元格中的一个列表与相应的标题。ie:以下内容：| asset | name | id || a | john | 001|| NaN | dave

浏览 1提问于2018-11-10得票数 1

回答已采纳

2回答

Pandas不删除行

、

我正在尝试删除数据帧中的所有重复项。removeDuplicates = data.drop_duplicates() 第一行应该保留，所以第二次出现的县1也就是重复的应该被删除。但是，当我对此运行drop duplicates时，没有任何反应编辑:不要紧，它打印的是不同的数据帧。不应删除县1的第二个匹

浏览 0提问于2021-02-17得票数 0

点击加载更多