Pandas，删除基于其他列值的重复行

文章/答案/技术大牛

发布

2回答

、

True False False8 file3 False False True File1是prop1的2倍，file2是prop3的2倍，file3是每个道具的1倍。

浏览 6提问于2019-10-08得票数 2

回答已采纳

1回答

如果在多行中重复相同的列值，则更新- SQL / MYSQL。

、

如果相同列的值在多行中重复 create table if not exists cms(因为这个列<em

浏览 4提问于2016-11-01得票数 2

2回答

使用pandas和Python删除重复项

、、

我想删除基于我的第一列的重复项，让我们假设这是'id‘。我需要删除的值是数据最不完整的记录。我想根据我的列id删除重复的内容。但是，我希望删除的重复项取决于其他列中的

浏览 9提问于2017-08-13得票数 3

1回答

通过pandas保留Excel下拉列表

、、

我有一个excel文件，其中的标题有下拉列表，可用于根据特定的列值选择行( where语句所做的正是如此)。我将这个文件导入到pandas中并执行一些操作。假设我删除基于"emp_id“列的重复值” data = data.drop_duplicates(['emp_id']) 然后我把这个数据帧保存到excel中， data.to_

浏览 135提问于2020-01-15得票数 2

回答已采纳

1回答

在DataFrame中查找不同的最佳匹配

、

我不知道这是不是最好的标题，但这就是我得到的。我正在寻找的是为第一列中的所有值找到最佳匹配(基于最小距离)，而不会在第二列中有重复的匹配。4bar test 4foo testy 5 bar testy 5 我希望为第一列中的三个唯一值找到最佳匹配项

浏览 11提问于2020-04-16得票数 0

回答已采纳

1回答

仅根据某些列选择唯一行

、

我有一个SQL视图，我希望只基于某些列获得唯一的行。如果所有其他列都相同(不包括A)，则必须删除重复项。如果所有其他列(B除外)相同，则必须删除重复项。我使用了下面的代码，但它仍然给出了A的最大值，然后给出了B的最大值，我想要得到不同的行，不包括这两列，我

浏览 2提问于2022-03-02得票数 0

2回答

如何使用熊猫在特定列中删除重复值？

、、

目前，我将以下数据框架从Excel导入到熊猫中，并希望删除基于两列值的重复值。# Python 3.5.2 # Save the Excel workbook in a variable我想要的是删除那些基于数量和源列的重复

浏览 1提问于2018-03-18得票数 3

回答已采纳

1回答

如何删除大熊猫数据中的重复数据记录

、、、

嗨，亲爱的，我是学习蟒蛇和熊猫的新手。我想用Python和Pandas删除数据中包含重复数据的重复数据记录。在dataframe中，我有两个列"code“和"number”。有几个重复行对“代码”具有相同的值，每个行对应一个数字。我只希望保留一个代码，并保存最大的相应数目。例如："a“有三个值:7、

浏览 3提问于2020-06-17得票数 0

回答已采纳

2回答

寻找副本并创建一个列来指出大熊猫中的重复

、

|------|------|------|| m | q | e | 假设我有一个pandas注意，col1值对于0th和1st行是相同的。是否有方法仅基于duplicate entries查找数据文件上的所有Col1。此外，我还想添加另一列，比如is_duplicate，它将对我的DataFrame和False的所有

浏览 10提问于2020-07-24得票数 0

回答已采纳

2回答

Python Pandas Dataframe根据列值移除重复行

、

我有一个pandas dataframe，如果LE列是"AAA“，我会尝试删除重复的行。如果有一个"AAA“，但没有其他行具有相同的ID/名称，那么我想不去管这些行。，因为没有”David“的其他实例。带有"Jane“的行被保留，因为在LE列下没有"AAA”的实

浏览 3提问于2020-08-20得票数 1

2回答

是否有一种方法可以根据不可引用的列删除重复的行？

、、

我有一个熊猫dataframe df，其中有一个列z，其中填充了设置值。 lnks = [ ( 'a' , 'b' , { 'a' , 'b' } ) , ( '

浏览 0提问于2019-03-02得票数 1

回答已采纳

1回答

如何删除部分列上有重复值的行？

、

我正在创建将xlsx文件读取到pandas dataframe并向其添加新行的脚本。然而，我的问题是，我不想添加在前四列(总共包含5列)中具有相同值的重复项。第五个列值可以是任何值，但是基于这四列上的重复项，我想删除整行。除此之外，我的代码是全功能的。我可

浏览 26提问于2019-07-31得票数 0

回答已采纳

2回答

Pandas:如果一列重复而另一列不同，则删除行

、、、

我想删除pandas数据帧中的行，其中一列A中的值是重复的，而另一列B中的值不是给定A的重复。一个说明性的例子： df = pd.DataFrame({'A': ['cat', 'dog', 'cat', 'cat', '

浏览 30提问于2019-12-14得票数 0

回答已采纳

2回答

在pandas数据框中选择唯一的观测值

、

我有一个包含uniqueid列的pandas数据框。我想从基于此列的数据框中删除所有重复项，以便所有剩余的观测值都是唯一的。

浏览 0提问于2013-11-01得票数 7

回答已采纳

1回答

基于其他列值的重复行

、、

订单按照如下顺序从状态传递：“已放置”>“已确认”>“已发运”id_order dsc_status lead1confirmed 5 4 1 shipped 1 1 逻辑：例如，放置和确认之间的提前期时间差是3，所以我将放置的行重复4次(基于0的计数)，

浏览 37提问于2019-05-23得票数 1

回答已采纳

1回答

如何在pandas数据帧中删除所有重复出现的项或获取唯一值？

、、、

我有一个具有多次出现特定值的pandas数据框。我希望删除所有重复的值或替换为NaN，并最终获得具有任意数量的唯一值的列的名称。Pandas drop_duplicates函数只删除有重复值的行，但我想删除数据框中的值&#

浏览 56提问于2019-04-02得票数 1

回答已采纳

2回答

根据R中的条件对数据帧进行重复数据删除？

、、

我想要做的是根据变量"Name“对列表进行重复数据删除，但是因为其余的列对我来说很重要，所以我希望保留其中包含最多信息的行。例如，如果我在excel中对上述文件进行重复数据删除，它将保留第一个值"Jane“，并删除所有其他值。但是"Jane“的第一个值(行no3)在其他</

浏览 2提问于2012-11-29得票数 3

回答已采纳

1回答

Pandas Dataframe丢弃记录及其副本

我希望删除基于列的pandas Dataframe中具有重复项及其重复项的记录

浏览 18提问于2019-11-14得票数 0

回答已采纳

1回答

如何在使用drop_duplicates (Pandas* DataFrame)时获得掉行？*

、、、

我使用pandas.DataFrame.drop_duplicates()删除所有列值相同的行的重复项，但是对于数据质量分析，我需要生成一个带有删除的重复行的DataFrame。如何识别要删除的行？我想到了比较原始的DF和没有重复的新的DF

浏览 10提问于2020-07-06得票数 1

回答已采纳

2回答

如何比较此循环中的日期值以查找重复项

、

我有一个检查重复项并使用指定列中的值删除它们的函数。如果我使用除带有日期的列A之外的任何其他列，它工作得很好，但如果我使用列A，它就不能工作。function removeDuplicates

浏览 63提问于2019-08-14得票数 0

回答已采纳

点击加载更多