腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
删除
在
dataframe
中
两
列
重复
的
对象
、
、
、
、
我有一个这样
的
数据框架: ? CSV文件
中
的
数据集是here。 此数据是从IMDb数据集中提取
的
。但是我有一个问题,我无法
删除
在
同一行
中
重复
的
演员
的
名字,例如在第4行
中
,我想在姓名和演员
列
中
删除
'Marie Gruber‘。我尝试使用and来应用所有条件,但代码始终认为它是相同
的
。像这样
的
代码:
浏览 51
提问于2021-09-20
得票数 1
回答已采纳
3
回答
利用比较函数
的
熊猫drop_duplicates
、
用比较运算符来比较某一
列
中
的
两
个
对象
,以识别
重复
的
对象
,是否有可能使用?如果没有,还有什么可供选择
的
?下面是一个可以使用它
的
例子: df = p
浏览 9
提问于2016-09-15
得票数 4
回答已采纳
1
回答
dask
dataframe
删除
重复
索引值
、
、
、
、
我使用
的
是python2.7
中
的
dataframe
,并且希望从我
的
df
中
删除
重复
的
索引值。当我用熊猫
的
时候而且起作用了 我可以重置索引,而不是使用作为索引<
浏览 0
提问于2017-11-28
得票数 1
回答已采纳
1
回答
模仿大熊猫
的
价值
、
我正在尝试消除我
的
DataFrame
的
一些
重复
值,但没有成功,使用
的
是pandas。我
的
DataFrame
有
两
列
,但我只需要处理其中一个主题,但我无法实现所需
的
内容。 ? 重要
的
一栏是第二个。我需要
删除
多次出现
的
值。 如果您有任何问题,请随时提出!编辑:我正在添加我尝试过但没有成功
的
内容 df = pd.read_csv(str(canci
浏览 6
提问于2019-01-11
得票数 0
回答已采纳
1
回答
在
特定列上添加来自其他数据帧
的
列
,同时保留原始索引
、
、
、
、
Pandas新手入门,并尝试基于
两
个数据帧共有的
列
从df2向df1添加
列
。我想保留df1
中
的
索引。注意,df2有很多
重复
的
行,包括
重复
的
ItemIds。
DataFrame
1 0 12 7
DataFrame
2 0 column1 ItemId column_to_merge50758 5
浏览 9
提问于2019-07-09
得票数 0
回答已采纳
2
回答
那些突出显示
的
行应该做什么?
、
我不知道下面的评论是怎么做
的
,有人能帮我一下吗?
浏览 2
提问于2022-03-09
得票数 0
回答已采纳
1
回答
检索
列
中
每个日期
的
出现次数
、
我有一个名为df
的
数据帧,它有一个名为date
的
列
,其中有许多日期不是唯一
的
。我想创建另一个包含
两
列
的
dataframe
:一
列
名为date,另一
列
名为count,对于每个日期,我想知道它被
重复
了多少次。我使用了像这样
的
date_count=df['date'].value_counts()方法value_counts,它返回一个以数据作为索引
的</em
浏览 10
提问于2020-04-07
得票数 0
回答已采纳
3
回答
Spark SQL
DataFrame
- distinct() vs dropDuplicates()
、
、
、
在
查看
DataFrame
应用程序接口时,我可以看到
两
种不同
的
方法执行相同
的
功能,用于从数据集中
删除
重复
项。 我可以理解dropDuplicates(colNames)将只考虑
列
的
子集来
删除
重复
项。这
两
种方法之间还有其他区别吗?
浏览 0
提问于2016-02-27
得票数 22
2
回答
通过
删除
不同
的
列
并聚合剩余
的
行来消除
重复
行
、
、
、
、
我有一个具有
重复
行
的
dataframe
,仅仅因为
两
个
列
是不同
的
。
列
[A]应该具有唯一
的
值,并且是确定
重复
行
的
关键。如图所示,
列
[A]
在
434处显示一个
重复
,因为[B]和[C]包含不同
的
对象
。因此,对于每一行,
列
[D]从8拆分为3和5,[E]被
重复
。(D
列
是基于对本例不重要<e
浏览 1
提问于2018-01-03
得票数 2
回答已采纳
2
回答
在
重复
其他
列
中
的
关联值时
删除
重复
项
、
当
重复
两
个名为"ID“和”年份“
的
列
中
的
关联值时,我希望
删除
名为"employee”
的
列
中
的
重复
值。例如,如果这是
DataFrame
:,这就是我想要
的
:这就是我所做
的
,但并没有奏效: df.loc[((df["ID"].duplicated()) & (df
浏览 6
提问于2021-11-01
得票数 1
回答已采纳
1
回答
通过如何=‘inner’合并
两
个带有公共列名
的
df
、
、
、
、
我希望合并dfa和dfb来创建df_merged,但是我希望合并
两
个有共同之处
的
列
,而不是创建A_x和A_y这样
的
列
。Angel 1 2 3 1 2 53我一直在读类似的问题,但我没有办法解决我
的
问题这只是我
的
数据摘录
浏览 3
提问于2021-08-25
得票数 1
回答已采纳
2
回答
如何检查pandas.
Dataframe
中
的
重复
列?
、
、
、
、
我必须处理部分原始、部分提取
的
数据。我怀疑这
两
列
是
重复
的
。
在
SQL
中
,我可以这样做但是我如何在pandas.
Dataframe
的
Python
中
做类似的事情呢?更具体地说,我如何比较csv文件和/或
Dataframe
对象
的
两
列</em
浏览 1
提问于2018-10-13
得票数 0
1
回答
Python -从
dataframe
计数不同
的
行。
、
、
、
、
我有以下格式
的
数据:我希望计算一下键(UserId, CurrentUserLocationId, RegisteredUserLocationId)
的
独特外观数量。例如,如果双(1, 1, 1)出现一次,我希望停止计数,并将其包含在最终结果
中
。因此,每一对唯一
的
出现,我只需要数一次。我尝试
的
是使用groupby(['col1', 'c
浏览 2
提问于2017-05-08
得票数 0
回答已采纳
3
回答
根据pandas
中
的
条件
删除
重复
的
列
、
、
、
、
我有一个
DataFrame
,其中有一个
重复
的
列
,即天气。As Seen in this picture of
dataframe
。其中一个包含我想要从
DataFrame
中
删除
的
NaN值。我试过这个方法 data_cleaned4.drop('Weather', axis=1) 它像应该
的
那样
删除
了这
两
列
。我试图传递一个条件来
删除</em
浏览 40
提问于2021-01-09
得票数 1
1
回答
检测导致行唯一性
的
熊猫
列
、
我试图
在
熊猫
DataFrame
中
删除
多
列
的
重复
行。问题是,必须有一些具有唯一值
的
列
,因为df.drop_duplicates(subset=None, keep='first', inplace=True)并没有
删除
我希望它
删除
的
所有行。选择
两
行在我看来是
重复
的
,我尝试了一个视觉比较,但无法识别它们之间<em
浏览 6
提问于2020-06-24
得票数 1
回答已采纳
2
回答
不能从.csv栏
中
移除大熊猫
的
副本
、
、
我试图对包含地址
的
.csv做一些非常简单
的
事情。如果任何行包含单列(‘Addresses’)
中
的
重复
值,我希望使用熊猫函数drop_duplicates()
删除
它们。每当我尝试使用drop_duplicates()并将我
的
数据帧打印或保存到一个新
的
.csv时,
重复
的
行/值仍然存在。81212th St619 81
浏览 4
提问于2019-06-11
得票数 0
回答已采纳
1
回答
如何在一个工作簿
的
多个Excel表
中
删除
重复
的
列
?
、
、
我
在
一个Excel工作簿中有多个工作表,每个工作表中都有
重复
的
列
。我需要
删除
重复
的
列
,只保留原始
列
。 我知道如何在工作表
中
删除
重复
项。excel files sheet names # Load the xlsx files Data sheet as a
dataframe
,head
浏览 9
提问于2019-05-16
得票数 1
1
回答
python上
的
Pandas数据帧
、
我觉得这可能是一个非常简单
的
问题,但我想不出来,我有一个数据框,看起来像这样 one two three 3 4 4 第三
列
有
重复
项,如果我想保留第一行,但
删除
第二行,因为第二行有
重复
项,我该怎么做呢?
浏览 22
提问于2021-09-29
得票数 0
回答已采纳
1
回答
删除
由
重复
字母组成
的
单词
、
、
、
我有一个包含文本数据
的
dataframe
列
。它几乎没有完全由
重复
字母组成
的
单词,也没有几个部分由
重复
字母组成
的
单词。我想
删除
由完全
重复
的
字母组成
的
单词,只保留第一次出现
的
字母(如果
重复
字母
的
计数超过2)
在
dataframe
列
中
。该怎么做呢?例如,如果我
的
<e
浏览 15
提问于2019-03-31
得票数 0
回答已采纳
2
回答
通过检查每个元素从PySpark数组
列
中
删除
重复
项
、
、
、
、
我有一个包含
两
个数组
列
的
Spark
dataframe
:用var2
列
的
值检查
列
var1
的
每个元素,并从var1
中
删除
以下单词:部分(例如,1 word - tea)或完全<code>E 210</code>(例如,
两
个
浏览 3
提问于2022-08-01
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
在Word中如何快速删除重复内容?
如何对 dataframe中的某一列数据 开根号呢?
在Power BI中优化Power Query合并的性能:删除列
【Excel】提取一列中的不重复值函数
两个小窍门,教你快速隐藏或删除表格中的重复记录
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券