腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
在
同一
列
中
只
保留
一个
重复
的
值
,
并
保留
NAs
r
我得到了这样
的
列
,其中有一些
重复
值
structure(list(id = c(1, 1, 1, 1, 1, 1, 1, 1), date = c(NA, NA,/01", "2012/01/01", "2012/01/01", "2012/05/01" )), class = "data.frame", row.names = c(NA, -8L)) 我只
浏览 42
提问于2021-05-10
得票数 0
回答已采纳
1
回答
如何使用
NAs
提取唯一
值
r
、
unique
我需要从
列
中提取唯一
的
值
,但我需要
保留
NAs
...when --我使用了unique() --它
只
返回与
NAs
...is不同
的
值
--有一种方法可以筛选惟一
的
值
,
保留
NAs
?我
的
专栏包括文章
的
内容,但其中有一些内容。我使用unique()来解释我
的
示例
中
的
重复
浏览 2
提问于2022-06-25
得票数 1
回答已采纳
3
回答
根据不同
列
中
NAs
的
数目,删除具有
重复
项
的
行。
r
、
dplyr
我想根据其他
列
中
NAs
的
数量,删除
列
a具有
重复
值
的
行。这与此类似,但我无法让计数
的
NAs
与那里
的
解决方案一起工作。) a b c d2 y 2 2 24 z 4 NA 46 z 3 4 NA 我
只
希望
在
列
a中
保留</em
浏览 6
提问于2018-10-28
得票数 1
回答已采纳
1
回答
如何删除大熊猫数据
中
的
重复
数据记录
python
、
pandas
、
dataframe
、
duplicates
嗨,亲爱
的
,我是学习蟒蛇和熊猫
的
新手。我想用Python和Pandas删除数据
中
包含
重复
数据
的
重复
数据记录。
在
dataframe
中
,我有两个
列
"code“和"number”。有几个
重复
行对“代码”具有相同
的
值
,每个行对应
一个
数字。我
只
希望
保留
一个
代码,
并
保存最大
的<
浏览 3
提问于2020-06-17
得票数 0
回答已采纳
1
回答
仅取R
中
数据框所有
列
的
重复
in
的
最大
值
r
、
dplyr
、
data.table
、
tidyr
我有24525行22
列
的
数据帧。最后一
列
是ID
列
,其他
列
是数字
列
。唯一ID数为18414,部分ID
重复
次数超过2次。 我需要删除
重复
的
ID,并且
只
保留
另
一个
数据框
中
每个ID和每
列
的
最大
值
。我尝试
在
for循环中对每一
列
进行排序,
并
删除
重复
项以
浏览 0
提问于2021-01-13
得票数 0
5
回答
删除特定
列
中
具有特定
值
的
重复
行
r
、
dataframe
我有
一个
数据框架,我希望删除除一
列
以外
的
所有
列
中
重复
的
行,
并
选择
保留
不确定
值
的
行。在上面的示例
中
,除了col3之外,所有
列
都
重复
第3行和第4行,所以我只想
保留
一行。复杂
的
步骤是我想
保留
第4行而不是第3行,因为col3
中
的
第3行是“排除”
的
浏览 2
提问于2020-03-27
得票数 3
回答已采纳
1
回答
如何在
保留
最新版本
的
同时从火花数据框架
中
删除
重复
项?
pyspark
、
apache-spark-sql
我想删除基于数据帧
的
两
列
的
重复
,
保留
最新
的
(我有时间戳
列
)。最好
的
办法是什么?请注意,副本可能分布
在
分区之间。我是否可以删除
保留
上一张记录
的
副本而不进行洗牌?我
在
处理1 TB
的
数据。我想通过这两
列
对数据框架进行分区,这样所有
重复
的
记录都将被“一致散
列
”到
同一个
分区
中<
浏览 0
提问于2019-04-12
得票数 7
回答已采纳
1
回答
巨蟒大熊猫如何有选择地丢弃复制
python
、
pandas
、
dataframe
我需要查看
列
'b‘
中
的
所有行,如果该行不是空
的
,则转到另
一个
相应
的
列
'c’,
并
对第三
列
'c‘
中
的
所有其他行删除此特定索引
的
重复
项,同时
保留
该特定索引。我不能对整个
列
使用drop_duplicates,因为我希望
在
该
列
中
保留
可能只对应于'
浏览 6
提问于2016-09-22
得票数 1
回答已采纳
2
回答
SQL
中
的
重复
数据
mysql
、
sql
、
database
我必须在我
的
数据库中
保留
重复
的
数据,所以我
的
问题is...Is最好将
重复
的
数据保存在
同一个
表
中
,
并
只
添加一
列
来标识原始数据,或者我必须创建另
一个
表来保存复制
的
数据?
浏览 15
提问于2016-08-06
得票数 3
2
回答
基于
重复
列
值
的
熊猫数据过滤- Python
python
、
pandas
、
dataframe
因此,我有
一个
这种类型
的
数据框架: Alex 10 40 20 11 5012 50 15 43 John 50 15 100 8 21 我试图
只
保留
所有唯一行
值
都具有
重复
值
的
列
例如,<
浏览 6
提问于2022-11-17
得票数 1
回答已采纳
1
回答
根据除
一个
以外
的
条件忽略
重复
项
sql
、
ms-access
、
distinct
我有
一个
表
在
微软
的
访问,每天都会更新。我需要根据保单编号删除
在
同一
开始日期内发布
的
所有
重复
项,但
只
保留
survey_number
列
中
编号最高
的
一条记录。例如,在下面的屏幕截图中,我们
在
同一
开始日期有两个保单编号为"4204556734“
的
记录,我希望删除排名较差
的
行,
并
保留<
浏览 6
提问于2020-02-21
得票数 1
回答已采纳
1
回答
删除
重复
项
并
保留
最上面的
值
excel
、
excel-formula
、
duplicates
在
我
的
电子表格
中
,我已经将两
列
数据合并为一
列
,
并
对它们进行了颜色编码。列表中大约有300个
重复
项。 如何删除
重复
项
并
保留
最上面的
值
?使用删除
重复
项或过滤器>高级过滤器(仅限唯一记录)可从两个列表(
在
同一
列
中
)
中
删除
重复
项。我希望最上面的列表(我
的
颜色与
浏览 1
提问于2013-07-12
得票数 3
回答已采纳
3
回答
我在数据集中有
重复
的
I,并且希望跨数据
列
保留
NAs
数量最少
的
I
r
、
duplicates
、
na
我有
一个
具有
重复
IDS
的
数据帧。我希望
保留
具有最少
NAs
数量
的
ID (因此,该ID
的
设置最完整)。
在
本例
中
,我希望
保留
第二个123和第二个124 (租借
NAs
)以下是示例数据
浏览 1
提问于2021-05-16
得票数 1
1
回答
使用python
中
的
两个条件过滤数据
python
、
pandas
、
numpy
、
filter
我想使用两种不同
的
条件过滤数据。但我想省略不满足条件
的
行,
只
希望
保留
在A
列
中
至少出现两次
的
值
df1 = df[(df['A-B occurrence'] >= 3) & (df['A occurrence'] >= 2)]上面是我正在使用
的
代码,这是我得到
的
输出:因此,
在
A
列
中
,1
浏览 2
提问于2021-10-28
得票数 1
回答已采纳
1
回答
Excel VBA宏,用于根据多
列
删除
重复
行并与另一
列
和
excel
、
vba
它有A列到J
列
中
的
数据。这意味着,如果所有A到I
列
中
的
值
都是
重复
的
,则应将两行视为
重复
。1)将
值
加到J
列
中
,J
列
包含数字。2)
保留
一
浏览 4
提问于2018-03-18
得票数 0
回答已采纳
1
回答
使用dplyr从向量
列
中
删除NA元素
r
、
dplyr
、
purrr
、
pmap
我试图将
列
合并成
一个
列
,我使用pmap将它们组合在一起。 有些列有
NAs
,我希望从合并
的
列
col_comb
中
删除
NAs
,
并
保留
其他
值
。
浏览 3
提问于2021-03-24
得票数 1
回答已采纳
1
回答
删除googlesheet
中
的
重复
值
google-apps-script
、
google-sheets
如何水平删除google工作表
中
的
重复
值
。如果这些
值
是
重复
的
,我如何删除它们并且
只
保留
一个
值
。
只
保留
第
一个
值
,
并
删除所有给定电子表格
中
重复
的
第二个
值
。有
重复
的
值
作为水平显示,如何删除它
浏览 6
提问于2022-01-18
得票数 0
2
回答
删除与特定字符串对应
的
行,但
保留
NA
值
。
r
、
subset
、
na
当特定
列
中
的
行对应于
一个
字符串时,我希望删除数据帧
中
的
所有行,但
保留
NAs
: 当数据
的
第一
列
具有名为" string“
的
字符串
值
时,将删除数据帧
中
的
所有行。但是我
的
第一
列
也有缺失
的
值
-- NA s,所以当我使用df <- df[df$Col1!="
浏览 1
提问于2020-09-13
得票数 1
回答已采纳
2
回答
组合两个表
的
最佳方法,删除
重复
项,但在SQL中
保留
所有其他非
重复
值
。
sql
、
join
、
google-bigquery
、
union
我正在寻找将两个表组合在一起
的
最佳方法,这种方式将删除基于电子邮件
的
重复
记录,
并
优先使用“表2”
中
的
值
替换任何
重复
,我已经考虑了完全外部联接和UNION ALL ( Union all )将太大,因为每个表都有几个1000
列
。我希望创建这个组合表作为我
的
完整引用表,并将其保存为视图,这样我就可以引用它,而不必总是
在
我已经很复杂
的
语句中添加这样
的
联合或类似的内容。根
浏览 2
提问于2021-12-01
得票数 1
回答已采纳
5
回答
在
MSSQL
中
删除
重复
项
sql
、
sql-server
、
duplicates
、
sql-delete
在
MSSQL表
中
,我有3
列
。我有多个
重复
的
KeptValue。我需要删除所有的
重复
项
并
保留
1个。但我需要
保留
花费最多
的
那个。 我已经创建了2个视图。
重复
的
保留
值
列表VW_DUPLICATE1。
浏览 0
提问于2013-07-09
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Excel中快速筛选查找重复数据的必杀技
MySQL、Python中数据去重的操作方法
Python模块-Pandas(四)文件读写与数据处理
关于重复值的几种操作,收藏好
pandas系列学习(五):数据连接
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券