Pandas删除行中的重复项

文章/答案/技术大牛

发布

2回答

、、、

我有一个CSV文件，它的行中有多个重复值。我想删除这些重复的值，这样我就只剩下唯一的值了。Account T3523 Domain Account T4252 Local Account T3523 预期的数据帧T3424 Local Account T3523 Domain Account T

浏览 14提问于2021-02-03得票数 0

回答已采纳

1回答

如何将set函数应用于特定列的所有行，该列的条目是具有重复值的列表？

、

在我的pandas数据框中，我有一个列，该列的每一行都是一个具有重复值的列表。例如，一个有3行的数据框：df = pd.DataFrame({'Column_1': [[1,2,3,2],[1,1,2],[1,2,3]]})我想要删除重复项。我的预期输出类似于[[1,2,3],[1,2],[1,2,3]]。如何应用set函数来删除</e

浏览 13提问于2020-08-03得票数 0

回答已采纳

1回答

如何在使用drop_duplicates (Pandas* DataFrame)时获得掉行？*

、、、

我使用pandas.DataFrame.drop_duplicates()删除所有列值相同的行的重复项，但是对于数据质量分析，我需要生成一个带有删除的重复行的DataFrame。如何识别要删除的行？我想到了比较原始的DF和没有重复的新的DF，并识别缺少<em

浏览 10提问于2020-07-06得票数 1

回答已采纳

3回答

如何删除pandas数据帧中的重复项，但保留基于特定列值的行

、、、、

我有一个有NBA球员统计数据的pandas数据框，我想删除重复的球员行。有重复的，因为有些球员在2020-2021赛季在多支球队踢球，我想删除这些重复的东西。然而，对于这些在多个球队踢球的球员，还会有一个行，其中包含该球员在所有球队的组合统计数据和团队标签'TOT'，这表示该球员在本赛季在两支或更多球队比赛的

浏览 1提问于2021-02-02得票数 0

3回答

Pandas:根据行值删除重复项

、、

我有一个数据帧，我想根据不同的条件删除重复的数据...3.0 6 5 5.0 8 - 5.1我想删除列A中除带有"-“的行之外的所有重复项。在此之后，我希望删除列A中的重复</em

浏览 29提问于2019-10-22得票数 3

回答已采纳

1回答

Python -为接近重复的行保留新列中的不同值，然后删除重复行

、、、

我有一个pandas dataframe，它是查询的结果，其中1列创建重复的行。我需要帮助通过名称识别重复项的非重复值，然后动态创建包含所有值的新列，然后删除重复项。下面的Mike在列"Code“中有重复项，Mark在"Lang”列中有重复项，所以我希望每行都有新的

浏览 0提问于2020-02-25得票数 1

1回答

有条件地删除重复的pandas* python*

、、、、

有没有办法有条件地在大约10列和400,000行的pandas数据框中删除重复项(特别是使用drop_duplicates )？也就是说，我希望所有有2列的行都满足一个条件:如果date (column)和store (column) #的组合是唯一的，则保留行，否则删除。

浏览 1提问于2015-05-03得票数 8

1回答

Pandas Dataframe丢弃记录及其副本

我希望删除基于列的pandas Dataframe中具有重复项及其重复项的记录

浏览 18提问于2019-11-14得票数 0

回答已采纳

2回答

Pandas不删除行

、

我正在尝试删除数据帧中的所有重复项。removeDuplicates = data.drop_duplicates() 第一行应该保留，所以第二次出现的县1也就是重复的应该被删除。但是，当我对此运行drop duplicates时，没有任何反应编辑:不要紧，它打印的是不同的数据帧。不应

浏览 0提问于2021-02-17得票数 0

2回答

如果两个文件具有相同的列值，则合并这些文件中的行

、、

目前，我正在亚马逊的网站上搜寻一些数据。我遇到的问题是，我不能真正从同一个页面获得一个产品的所有数据。我最终得到的是两个文件，它们具有相同的列标题，但列本身的数据不同。例如，在一个.csv文件中，产品包含信息的“代码”、“名称”、“url”、“大小”，而在另一个文件中，它包含“代码”、“价格”、“image1”、“image2”等等。如果file2中的代码与file1中的

浏览 10提问于2019-02-01得票数 1

回答已采纳

4回答

是否有一个函数可以在不使用Python删除整行的情况下删除行中的重复项？

、、、

import pandas as pd df=pd.DataFrame(data,columns=['Name','Problem1','Problem2'

浏览 6提问于2022-08-12得票数 0

1回答

如何显示DF中在python的一列中有重复值的所有行？

、、

但是，该列有许多重复值，因此合并不起作用(它会给出这样的错误：#检查重复的值)。另一个问题是df1['Number and postcode']也可能有许多重复的值。我该如何解决这个问题呢？这是我使用的公式： merged = pd.merge(df, df1[{'TOTAL_FLOOR_AREA', 'Bedrooms'}],how = 'inner', on = df['Num

浏览 5提问于2020-05-13得票数 0

2回答

删除spark中除null以外的重复项

、、

我在pandas中看到了一种删除重复项并忽略空值的方法。在spark中有没有一种方法可以在忽略空值(而不是删除那些行)时删除重复项？例如:我想去掉重复的"animal“val df1=sc.parallelize(Seq(

浏览 1提问于2020-09-19得票数 1

2回答

在pandas中保留NaNs的同时删除重复项

、

在使用drop_duplicates()方法时，我减少了重复项，但也将所有NaNs合并到一个条目中。如何在保留具有空项(如np.nan, None or '')的行的同时删除重复项？import pandas as pd df = pd.DataFrame({'col':['one','two',np.nan,np.nan,np.nan

浏览 1提问于2014-05-07得票数 20

2回答

如何在两列中删除具有重复值对的行？

、

我目前有一个Pandas DataFrame，并且希望删除在两列中有重复对的行。下面是一个例子，展示了我的意思：0 0 1 02 03 04 3 5 1假设我想根据col0和col2上的值对删

浏览 4提问于2019-11-18得票数 1

回答已采纳

1回答

如何在Pandas中复制后修改数据？

、

在Pandas中复制行之后，我正在尝试编辑值。我只想编辑一列(“代码”)，但我看到，由于它有重复的，它将影响整个行。 a = df['code'] == 12

浏览 0提问于2019-08-05得票数 1

回答已采纳

3回答

根据两列A、B从数据帧中删除重复项，将具有最大值的行保留在另一列C中

、、、

我有一个pandas dataframe，它根据两列(A和B)包含重复的值：1 2 12 7 13 4 8 我希望删除重复项，并将最大值行保留在列C中。

浏览 162提问于2015-08-19得票数 75

回答已采纳

1回答

pandas DataFrame选择特定数据

、、、

我想构建一个for循环，只选择pandas中的第5行、第10行和第14行。 enter image description here 实际文件包括数千行类似格式的行。请教我一个可以遍历整个文件的函数。非常感谢！附件是我目前的进度： df = pd.read_csv('C:/Users/ymx19/Desktop/EHS/Location&

浏览 14提问于2021-08-31得票数 0

1回答

在Python中操作CSV文件

、、、

in Names: Names.add(row[0])任何帮助都是非常感谢的。附注-- Pandas库在我<e

浏览 1提问于2015-11-17得票数 0

2回答

如何在列中找到重复行，然后找出另一列中的两个单元格是否等于Python中Excel选项卡中的第三个单元格？

、、

我需要在"Name“列中找到所有重复的行(字符串值)，然后在Pandas (Python)的Excel选项卡中的Excel选项卡中，查找两个数字值是否等于第三个值的总和。这个工作表中有两个选项卡。例如，在下表中，"Name“列中有几个重复项。但是对于"Richard Madden“重复项，则在”value“表(-40

浏览 0提问于2022-01-17得票数 0

回答已采纳

点击加载更多