df.drop_duplicates()对数据帧不起作用

、

我不确定问题出在哪里，但是在我执行了一条SQL join语句之后，我用我所有的数据创建了一个数据帧。我最终得到的是一个带有重复项的数据帧。然后，我应用了df.drop_duplicates()，但我的数据帧根本不接受它，我得到了相同的结果。下面是我正在使用的数据类型的列表。这可能与此有关吗？df.drop_duplicates() session id scr

浏览 0提问于2018-08-10得票数 0

回答已采纳

2回答

将重复的行拖放到另一个数据帧

、、

以下是数据示例：df = pd.DataFrame({file prop1 prop2 prop33 file2False Fal

浏览 0提问于2019-10-07得票数 1

1回答

为什么熊猫drop_duplicates()似乎对我不起作用？

、、、、

我使用，但它似乎不起作用。我该如何解决这个问题？

浏览 0提问于2015-10-27得票数 0

1回答

将多行合并为1行

、、、

pd.read_csv()的数据John None None NoneNone None生成的数据帧将有2行。尝试使用df.ffill()/df.bfill()和df.drop_duplicates()，但不起作用。

浏览 5提问于2017-02-04得票数 4

回答已采纳

1回答

python上的Pandas数据帧

、

我觉得这可能是一个非常简单的问题，但我想不出来，我有一个数据框，看起来像这样 one two three 3 4 4 第三列有重复项，如果我想保留第一行

浏览 22提问于2021-09-29得票数 0

回答已采纳

1回答

如何以平衡的方式进行drop_duplicates？

、、

我想以一种平衡的方式从数据帧中删除重复项。目前，df.drop_duplicates()有一个参数keep，您可以在其中决定保留第一个还是最后一个出现的内容。也就是说，我有这个数据帧，有两列:文本和类别，看起来很平衡，但有重复项：再次应用drop_duplicates()并绘制，将如下所示：df['Category'].value_counts().plot(k

浏览 20提问于2021-03-08得票数 0

1回答

pandas删除重复项不返回已删除重复项的数据帧

、、

我有一个数据框架：我希望从此数据帧中删除列src和trg的重复项 df = df.drop_duplicates(subset=['src','trg'],

浏览 0提问于2020-03-02得票数 0

1回答

理解为什么drop.duplicates()不起作用

、

假设我有一个2行的pandas数据帧，它是通过对一个更大的数据帧进行子化而获得的。即便如此，没有任何效果。它们的字段长度都是一样的。如何让它正常工作？

浏览 21提问于2018-06-05得票数 3

回答已采纳

1回答

在组内计数不同的/非唯一的

、、

我想在每一组中计算不同的元组数： 'b': [1, 2, 1, 2, 1, 2, 1, 2],counts = count_distinct(df, by='a&

浏览 0提问于2016-09-05得票数 2

回答已采纳

1回答

返回所有没有重复项的集群

、

43 13 34 44 7ID Item1 22 54 6我尝试了下面的操作，它保留了第一次出现的情况

浏览 0提问于2020-04-27得票数 2

1回答

在Dask中实现快速drop_duplicates()的实践

、、、、

我想从一个大数据帧中删除副本。我想知道怎样才能更快地从数据帧中删除副本。这是我的密码： df = df.drop_duplicates

浏览 3提问于2022-08-30得票数 0

1回答

如何显示DF中在python的一列中有重复值的所有行？

、、

我有两个数据帧，我正尝试基于一个列(df['Number and postcode'])合并它们。但是，该列有许多重复值，因此合并不起作用(它会给出这样的错误：#检查重复的值)。

浏览 5提问于2020-05-13得票数 0

2回答

DataFrame.drop_duplicates和DataFrame.drop不删除行

、

我已经将csv读入到pandas数据帧中，它有五列。某些行只在第二列中有重复的值，我想从数据帧中删除这些行，但drop和drop_duplicates都不起作用。duplicate rtc valuedf.drop_duplicates

浏览 0提问于2014-09-06得票数 10

回答已采纳

2回答

如何从数据帧中删除重复项？

、

x 2008 NaN原始数据指示器是这样一个事实的结果，即这些观测值中的一些是为了获得每个IDnumber的所有三年而创建的，而另一些则存在于原始数据集中。我想要实现的是去掉重复的数据，并提前保留原始数据。请注意，原始数据指示器并不总是最后一个观察值。为了解决这个问题，我首先对Idnumber Date Originaldatai

浏览 1提问于2016-02-16得票数 4

回答已采纳

1回答

如何删除python数据报中的重复行并分配给新数据报，但保留原始原始数据帧

、、

我是python的新手，在编写python代码时犯了一个错误，就像我对SAS一样。有没有办法从数据帧中删除基于一组关键字的重复行，并将其分配给新的数据报，同时保留原始原始数据帧

浏览 15提问于2020-08-03得票数 0

2回答

Pandas:如果一列重复而另一列不同，则删除行

、、、

我想删除pandas数据帧中的行，其中一列A中的值是重复的，而另一列B中的值不是给定A的重复。df.drop_duplicates('A')删除了第2行和第3行，df.drop_duplicates(subset=['A', 'B'])删除了第2行；我在这里寻找的也不是[ 1]。

浏览 30提问于2019-12-14得票数 0

回答已采纳

1回答

我正在尝试用来自API的数据更新Pandas Dataframe，并将其写入.csv，我需要确保它不包含重复的行。我让熊猫们读了csv df = pd.read_csv(file) 然后，我从API下载了更多的数据(我确保我有重复的行)并创建df2 ( csv是由相同的代码编写的，所以我确信重复的行是完全相同的)。现在，我需要将一个数据帧附加到另一个数据帧，然后删除重复的数据帧： df = df.append(df2, ignore_index=Tru

浏览 4提问于2019-04-13得票数 1

回答已采纳

2回答

在Dataframe列中保留重复项的第一个和最后一个条目

、、、

我有一个很大的数据框架，里面有很多重复的数据。我希望保留每个副本的第一个和最后一个条目，但删除其中的每个副本。我已经尝试过通过使用带有参数' first‘和' last’的df.drop_duplicates来获取两个数据帧，然后将它们再次合并到一个df，这样我就拥有了第一个和最后一个条目，但这并不起作用。

浏览 235提问于2019-10-02得票数 3

回答已采纳

2回答

删除特定列的数据框中的重复行

、、、

我有一个数据帧，如下所示： Districtname pincode1 central delhi 110002 2

浏览 8提问于2019-09-03得票数 0

回答已采纳

1回答

熊猫没有在一栏中列出每一个唯一的价值

、、、

我试图在一列中列出每个唯一的值，这样我就可以复制和粘贴它们。但是，当我这样做时，它似乎只列出了列中的前1000个唯一值。df['Emojis'].nunique() 然后，当我使用这段代码列出列中的所有唯一值时，它似乎只列出了第一个1000唯一值，在该值后面跟着一个...。['', '', '', '☺',

浏览 1提问于2021-06-27得票数 0

回答已采纳

点击加载更多