删除在dataframe中两列重复的对象

、、、、

我有一个这样的数据框架： ? CSV文件中的数据集是here。此数据是从IMDb数据集中提取的。但是我有一个问题，我无法删除在同一行中重复的演员的名字，例如在第4行中，我想在姓名和演员列中删除'Marie Gruber‘。我尝试使用and来应用所有条件，但代码始终认为它是相同的。像这样的代码：

浏览 51提问于2021-09-20得票数 1

回答已采纳

3回答

利用比较函数的熊猫drop_duplicates

、

用比较运算符来比较某一列中的两个对象，以识别重复的对象，是否有可能使用？如果没有，还有什么可供选择的？下面是一个可以使用它的例子： df = p

浏览 9提问于2016-09-15得票数 4

回答已采纳

1回答

dask dataframe删除重复索引值

、、、、

我使用的是python2.7中的dataframe，并且希望从我的df中删除重复的索引值。当我用熊猫的时候而且起作用了我可以重置索引，而不是使用作为索引<

浏览 0提问于2017-11-28得票数 1

回答已采纳

1回答

模仿大熊猫的价值

、

我正在尝试消除我的DataFrame的一些重复值，但没有成功，使用的是pandas。我的DataFrame有两列，但我只需要处理其中一个主题，但我无法实现所需的内容。 ? 重要的一栏是第二个。我需要删除多次出现的值。如果您有任何问题，请随时提出！编辑:我正在添加我尝试过但没有成功的内容 df = pd.read_csv(str(canci

浏览 6提问于2019-01-11得票数 0

回答已采纳

1回答

在特定列上添加来自其他数据帧的列，同时保留原始索引

、、、、

Pandas新手入门，并尝试基于两个数据帧共有的列从df2向df1添加列。我想保留df1中的索引。注意，df2有很多重复的行，包括重复的ItemIds。DataFrame 1 0 12 7DataFrame 2 0 column1 ItemId column_to_merge50758 5

浏览 9提问于2019-07-09得票数 0

回答已采纳

2回答

那些突出显示的行应该做什么？

、

我不知道下面的评论是怎么做的，有人能帮我一下吗？

浏览 2提问于2022-03-09得票数 0

回答已采纳

1回答

检索列中每个日期的出现次数

、

我有一个名为df的数据帧，它有一个名为date的列，其中有许多日期不是唯一的。我想创建另一个包含两列的dataframe :一列名为date，另一列名为count，对于每个日期，我想知道它被重复了多少次。我使用了像这样的date_count=df['date'].value_counts()方法value_counts，它返回一个以数据作为索引的</em

浏览 10提问于2020-04-07得票数 0

回答已采纳

3回答

Spark SQL DataFrame* - distinct() vs dropDuplicates()*

、、、

在查看DataFrame应用程序接口时，我可以看到两种不同的方法执行相同的功能，用于从数据集中删除重复项。我可以理解dropDuplicates(colNames)将只考虑列的子集来删除重复项。这两种方法之间还有其他区别吗？

浏览 0提问于2016-02-27得票数 22

2回答

通过删除不同的列并聚合剩余的行来消除重复行

、、、、

我有一个具有重复行的dataframe，仅仅因为两个列是不同的。列[A]应该具有唯一的值，并且是确定重复行的关键。如图所示，列[A]在434处显示一个重复，因为[B]和[C]包含不同的对象。因此，对于每一行，列[D]从8拆分为3和5，[E]被重复。(D列是基于对本例不重要<e

浏览 1提问于2018-01-03得票数 2

回答已采纳

2回答

在重复其他列中的关联值时删除重复项

、

当重复两个名为"ID“和”年份“的列中的关联值时，我希望删除名为"employee”的列中的重复值。例如，如果这是DataFrame：，这就是我想要的：这就是我所做的，但并没有奏效： df.loc[((df["ID"].duplicated()) & (df

浏览 6提问于2021-11-01得票数 1

回答已采纳

1回答

通过如何=‘inner’合并两个带有公共列名的df

、、、、

我希望合并dfa和dfb来创建df_merged，但是我希望合并两个有共同之处的列，而不是创建A_x和A_y这样的列。Angel 1 2 3 1 2 53我一直在读类似的问题，但我没有办法解决我的问题这只是我的数据摘录

浏览 3提问于2021-08-25得票数 1

回答已采纳

2回答

如何检查pandas.Dataframe中的重复列？

、、、、

我必须处理部分原始、部分提取的数据。我怀疑这两列是重复的。在SQL中，我可以这样做但是我如何在pandas.Dataframe的Python中做类似的事情呢？更具体地说，我如何比较csv文件和/或Dataframe对象的两列</em

浏览 1提问于2018-10-13得票数 0

1回答

Python -从dataframe计数不同的行。

、、、、

我有以下格式的数据：我希望计算一下键(UserId, CurrentUserLocationId, RegisteredUserLocationId)的独特外观数量。例如，如果双(1, 1, 1)出现一次，我希望停止计数，并将其包含在最终结果中。因此，每一对唯一的出现，我只需要数一次。我尝试的是使用groupby(['col1', 'c

浏览 2提问于2017-05-08得票数 0

回答已采纳

3回答

根据pandas中的条件删除重复的列

、、、、

我有一个DataFrame，其中有一个重复的列，即天气。As Seen in this picture of dataframe。其中一个包含我想要从DataFrame中删除的NaN值。我试过这个方法 data_cleaned4.drop('Weather', axis=1) 它像应该的那样删除了这两列。我试图传递一个条件来删除</em

浏览 40提问于2021-01-09得票数 1

1回答

检测导致行唯一性的熊猫列

、

我试图在熊猫DataFrame中删除多列的重复行。问题是，必须有一些具有唯一值的列，因为df.drop_duplicates(subset=None, keep='first', inplace=True)并没有删除我希望它删除的所有行。选择两行在我看来是重复的，我尝试了一个视觉比较，但无法识别它们之间<em

浏览 6提问于2020-06-24得票数 1

回答已采纳

2回答

不能从.csv栏中移除大熊猫的副本

、、

我试图对包含地址的.csv做一些非常简单的事情。如果任何行包含单列(‘Addresses’)中的重复值，我希望使用熊猫函数drop_duplicates()删除它们。每当我尝试使用drop_duplicates()并将我的数据帧打印或保存到一个新的.csv时，重复的行/值仍然存在。81212th St619 81

浏览 4提问于2019-06-11得票数 0

回答已采纳

1回答

如何在一个工作簿的多个Excel表中删除重复的列？

、、

我在一个Excel工作簿中有多个工作表，每个工作表中都有重复的列。我需要删除重复的列，只保留原始列。我知道如何在工作表中删除重复项。excel files sheet names # Load the xlsx files Data sheet as a dataframe,head

浏览 9提问于2019-05-16得票数 1

1回答

python上的Pandas数据帧

、

我觉得这可能是一个非常简单的问题，但我想不出来，我有一个数据框，看起来像这样 one two three 3 4 4 第三列有重复项，如果我想保留第一行，但删除第二行，因为第二行有重复项，我该怎么做呢？

浏览 22提问于2021-09-29得票数 0

回答已采纳

1回答

删除由重复字母组成的单词

、、、

我有一个包含文本数据的dataframe列。它几乎没有完全由重复字母组成的单词，也没有几个部分由重复字母组成的单词。我想删除由完全重复的字母组成的单词，只保留第一次出现的字母(如果重复字母的计数超过2)在dataframe列中。该怎么做呢？例如，如果我的<e

浏览 15提问于2019-03-31得票数 0

回答已采纳

2回答

通过检查每个元素从PySpark数组列中删除重复项

、、、、

我有一个包含两个数组列的Spark dataframe：用var2列的值检查列var1的每个元素，并从var1中删除以下单词：部分(例如，1 word - tea)或完全<code>E 210</code>(例如，两个

浏览 3提问于2022-08-01得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

利用比较函数的熊猫drop_duplicates

dask dataframe删除重复索引值

模仿大熊猫的价值

在特定列上添加来自其他数据帧的列，同时保留原始索引

那些突出显示的行应该做什么？

检索列中每个日期的出现次数

Spark SQL DataFrame* - distinct() vs dropDuplicates()*

通过删除不同的列并聚合剩余的行来消除重复行

在重复其他列中的关联值时删除重复项

通过如何=‘inner’合并两个带有公共列名的df

如何检查pandas.Dataframe中的重复列？

Python -从dataframe计数不同的行。

根据pandas中的条件删除重复的列

检测导致行唯一性的熊猫列

不能从.csv栏中移除大熊猫的副本

如何在一个工作簿的多个Excel表中删除重复的列？

python上的Pandas数据帧

删除由重复字母组成的单词

通过检查每个元素从PySpark数组列中删除重复项

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐