腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
删除
基于
其他
列
的
重复
数据
帧
、
1A B procedureaa pass 1b pass 1 基本上,对于给定
的
过程,如果它再次运行,并且这一次是一次通过,我希望保留通过并
删除
失败。我不确定如何根据多个条件
删除
行
浏览 11
提问于2020-03-10
得票数 0
3
回答
删除
spark
数据
帧
中
重复
的
所有记录
、
、
、
、
我有一个包含多个
列
的
spark
数据
帧
。我想找出并
删除
列
中有
重复
值
的
行(
其他
列
可以是不同
的
)。我尝试使用dropDuplicates(col_name),但它只
删除
重复
的
条目,但仍然在
数据
帧
中保留一条记录。我需要
的
是
删除
所有最初包含
重复
条目的条目。我使用<em
浏览 4
提问于2018-04-10
得票数 5
回答已采纳
2
回答
基于
比较两
列
的
R中
删除
重复
值
、
、
我有这样
的
数据
:COL_2: Last_NameMichel JacksonMeganBakerSimon RichardMeg RyanMeg Meg 我想要清除两个
列
的
重复
名称
的
输出,例如Meg Ryan和Ryan Meg是相同
的
。因此,我
浏览 0
提问于2018-09-05
得票数 1
1
回答
如何在保留最新版本
的
同时从火花
数据
框架中
删除
重复
项?
、
我想
删除
基于
数据
帧
的
两
列
的
重复
,保留最新
的
(我有时间戳
列
)。最好
的
办法是什么?请注意,副本可能分布在分区之间。我是否可以
删除
保留上一张记录
的
副本而不进行洗牌?我在处理1 TB
的
数据
。我想通过这两
列
对
数据
框架进行分区,这样所有
重复
的
记录都将被“一致散
列
浏览 0
提问于2019-04-12
得票数 7
回答已采纳
1
回答
如何根据特定
列
中
的
值
删除
Pandas DataFrame中
的
重复
行?
、
、
我有两个
数据
帧
具有
重复
项,但我只需要
删除
具有
重复
VIN号
的
行,而不查看
其他
单元格。LLW63494 2020 BMW X5 最后两行看起来像熊猫
的
不同行,但我需要合并两个
数据
框并
删除
仅
基于
这些VIN编号
的
行,并忽略“未找到”和“需要详细信息
浏览 1
提问于2020-01-17
得票数 0
1
回答
根据
列
的
子集
删除
重复
项,保留
列
E中具有最高值
的
行&如果E中
的
值等于
列
B中具有最高值
的
行
、
、
、
假设我有以下
数据
帧
:我想
删除
基于
A、B和C
列
的
重复
项,保留E
列
最高
的
行。如果E
列
中
的
值相同,则保留D
列
最高
的
行。因此,上面的
数据
帧
将变成:我看到了答案
的
开头:<code&
浏览 7
提问于2021-06-11
得票数 1
回答已采纳
3
回答
检查Pyspark Dataframe中
的
重复
项
、
、
、
有没有一种简单有效
的
方法来检查python dataframe中
的
重复
项(而不是
删除
它们)?蒂娅。
浏览 7
提问于2018-05-02
得票数 9
回答已采纳
2
回答
按组更改
基于
其他
列
的
列
值
、
、
这样每个组
的
值都是相同
的
(
基于
Con_Num分组)。我希望在该
列
中
的
值是Is_Prim==Yes所在
的
行。 我见过transform函数,但在找出如何根据另一
列
进行映射时并不成功。
基于
示例
数据
帧
的
输出将如下所示: Con_Num Con_Type Is_Prim1 1 A YesC No 7
浏览 11
提问于2021-09-15
得票数 2
回答已采纳
2
回答
具有相同变量数
的
数据
帧
列表,
删除
一个变量内
的
重复
项,并在
其他
数据
帧
中执行相同
的
操作
、
、
、
、
我有以下
数据
帧
列表,每个
数据
帧
都有3个变量(a、b和c)在我
的
数据
帧
中,我在"a“中复制了字符串,我希望
删除
具有
重复
值
的
行。我正在使用的当前代码:这段代码
的
问题是,
其他
浏览 1
提问于2021-05-13
得票数 0
回答已采纳
1
回答
在组内计数不同
的
/非唯一
的
、
、
我想在每一组中计算不同
的
元组数: 'b':by='a', columns=['b', 'c']) assert counts == pd.Series([4, 2
浏览 0
提问于2016-09-05
得票数 2
回答已采纳
1
回答
仅取R中
数据
框所有
列
的
重复
in
的
最大值
、
、
、
我有24525行22
列
的
数据
帧
。最后一
列
是ID
列
,
其他
列
是数字
列
。唯一ID数为18414,部分ID
重复
次数超过2次。 我需要
删除
重复
的
ID,并且只保留另一个
数据
框中每个ID和每
列
的
最大值。我尝试在for循环中对每一
列
进行排序,并
删除
重复
项以保留最大值,但它不
浏览 0
提问于2021-01-13
得票数 0
2
回答
使用pandas和Python
删除
重复
项
、
、
我想
删除
基于
我
的
第一
列
的
重复
项,让我们假设这是'id‘。我需要
删除
的
值是
数据
最不完整
的
记录。 我想根据我
的
列
id
删除
重复
的
内容。但是,我希望
删除
的
重复
项取决于
其他
列
中
的
浏览 9
提问于2017-08-13
得票数 3
3
回答
Pandas处理大型CSV
数据
、
、
我正在使用pandas处理至少8 8GB大小
的
大型
数据
集。在我
的
理解中,分块整个文件将创建许多不同
的
数据
帧
。因此,使用我现有的例程,这只
删除
特定
数据
帧
上
的
重复
值,而不是整个文件上
的
重复
值。 我需要
删除
基于
“唯一键”
列
的
整个
数据
浏览 33
提问于2020-03-11
得票数 3
回答已采纳
1
回答
根据应用于2个非数字
列
的
a+b逻辑
删除
重复
项
这可能是不知道要搜索
的
正确关键字,但我正在寻找一种方法,
基于
两个非数字
列
之间
的
顺序颠倒来
删除
重复
项。,动物
的
顺序正好在前两
列
之间颠倒。
删除
哪一个并不重要,但我想
删除
其中一个副本...以及在我更大
的
数据
帧
中符合此逻辑
的
所有
其他
副本。我习惯于根据这些问题中
的
逻辑进行子分类:和
其他
提出搜索“
浏览 0
提问于2017-08-03
得票数 1
3
回答
join后如何重命名
重复
的
列
?
、
、
我想对3个
数据
帧
使用join,但是有一些
列
我们不需要,或者与
其他
数据
帧
有一些
重复
的
名称,所以我想
删除
一些
列
,如下所示: .join(cc_df, 'id', 'left') .withColumnRenamed(bb_df.status, &
浏览 0
提问于2018-05-11
得票数 9
回答已采纳
3
回答
对一个值在R中解压
数据
,选择
其他
列
的
任何值
‘,这样我就得到了tyler [1 or 2, I dont care]steph 3 我有一个唯一
的
标识符
列
,我想要不同
的
值,还有另外18个
列
,我需要一个,任意一个值。
浏览 2
提问于2014-02-07
得票数 4
回答已采纳
1
回答
使用Pandas将
重复
项提取到新
的
数据
帧
中
、
、
、
我有一个很大
的
数据
框,有很多
列
。其中一
列
应该是唯一
的
ID,另一
列
是年份。遗憾
的
是,唯一ID
列
中存在
重复
项。我知道如何生成所有
重复
项
的
列表,但实际上我想要做
的
是将它们提取出来,以便只保留第一个条目(按年)。例如,dataframe目前看起来像这样(有一堆
其他
列
):----------123 131
浏览 36
提问于2018-08-28
得票数 1
回答已采纳
2
回答
如何创建部分
重复
行
的
新
数据
(
基于
45
列
中
的
4
列
的
重复
数据
)
、
、
我有一个很大
的
数据
集,其中大约10%是“双重编码”。一名研究助理重新收集了部分
数据
的
数据
,这样我们就可以确保
数据
的
准确性。大多数情况下,我想检查拼写错误和
其他
不符之处。我只想将双编码行提取到一个新
的
数据
帧
中,这样我就可以读取它们以确保它们匹配,然后
删除
重复
的
行。 我可以根据4个ID
列
(链接、BillType、BillNumber
浏览 8
提问于2022-10-09
得票数 0
1
回答
从作为列表格式
的
数据
帧
列
中移除杜普斯
、
、
我在一
列
一
列
的
数据
帧
中有很多
重复
的
值。下面是一些示例,我查看了
其他
堆栈溢出问题,但我只能为列表找到答案,而不是针对
数据
帧
问题。当我在列表中传递值时,我能够
删除
重复
的
值,但是,当我像
数据
帧
一样传递它时,它会产生错误:TypeError: unhashable type: 'list' 我在这里做错什么了?err
浏览 0
提问于2018-08-21
得票数 1
回答已采纳
1
回答
如何合并两个有
重复
列
的
数据
框来连接每个字符串值?
、
、
、
具有两个具有相同列名(名称、部门)
的
数据
框。我正在尝试合并两个
数据
框,如果有任何
重复
的
名称,并将dept值连接到dept
列
。我希望第一个
数据
帧
上
的
行数保持不变,但如果有
重复
的
数据
帧
,则只将第二个
数据
帧
的
值添加到第一个
数据
帧
中。到目前为止,我已经尝试使用pandas .merg
浏览 0
提问于2019-10-30
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券