在同一列中只保留一个重复的值，并保留NAs_在R中只保留列中的某些值_在某些列上删除重复项并保留其他列值 - 腾讯云开发者社区

我得到了这样的列，其中有一些重复值 structure(list(id = c(1, 1, 1, 1, 1, 1, 1, 1), date = c(NA, NA,/01", "2012/01/01", "2012/01/01", "2012/05/01" )), class = "data.frame", row.names = c(NA, -8L)) 我只

浏览 42提问于2021-05-10得票数 0

回答已采纳

1回答

如何使用NAs提取唯一值

r、unique

我需要从列中提取唯一的值，但我需要保留NAs...when --我使用了unique() --它只返回与NAs...is不同的值--有一种方法可以筛选惟一的值，保留NAs？我的专栏包括文章的内容，但其中有一些内容。我使用unique()来解释我的示例中的重复

浏览 2提问于2022-06-25得票数 1

回答已采纳

3回答

根据不同列中NAs的数目，删除具有重复项的行。

r、dplyr

我想根据其他列中NAs的数量，删除列a具有重复值的行。这与此类似，但我无法让计数的NAs与那里的解决方案一起工作。) a b c d2 y 2 2 24 z 4 NA 46 z 3 4 NA 我只希望在列a中保留</em

浏览 6提问于2018-10-28得票数 1

回答已采纳

1回答

如何删除大熊猫数据中的重复数据记录

python、pandas、dataframe、duplicates

嗨，亲爱的，我是学习蟒蛇和熊猫的新手。我想用Python和Pandas删除数据中包含重复数据的重复数据记录。在dataframe中，我有两个列"code“和"number”。有几个重复行对“代码”具有相同的值，每个行对应一个数字。我只希望保留一个代码，并保存最大的<

浏览 3提问于2020-06-17得票数 0

回答已采纳

1回答

仅取R中数据框所有列的重复in的最大值

r、dplyr、data.table、tidyr

我有24525行22列的数据帧。最后一列是ID列，其他列是数字列。唯一ID数为18414，部分ID重复次数超过2次。我需要删除重复的ID，并且只保留另一个数据框中每个ID和每列的最大值。我尝试在for循环中对每一列进行排序，并删除重复项以

浏览 0提问于2021-01-13得票数 0

5回答

删除特定列中具有特定值的重复行

r、dataframe

我有一个数据框架，我希望删除除一列以外的所有列中重复的行，并选择保留不确定值的行。在上面的示例中，除了col3之外，所有列都重复第3行和第4行，所以我只想保留一行。复杂的步骤是我想保留第4行而不是第3行，因为col3中的第3行是“排除”的

浏览 2提问于2020-03-27得票数 3

回答已采纳

1回答

如何在保留最新版本的同时从火花数据框架中删除重复项？

pyspark、apache-spark-sql

我想删除基于数据帧的两列的重复，保留最新的(我有时间戳列)。最好的办法是什么？请注意，副本可能分布在分区之间。我是否可以删除保留上一张记录的副本而不进行洗牌？我在处理1 TB的数据。我想通过这两列对数据框架进行分区，这样所有重复的记录都将被“一致散列”到同一个分区中<

浏览 0提问于2019-04-12得票数 7

回答已采纳

1回答

巨蟒大熊猫如何有选择地丢弃复制

python、pandas、dataframe

我需要查看列'b‘中的所有行，如果该行不是空的，则转到另一个相应的列'c’，并对第三列'c‘中的所有其他行删除此特定索引的重复项，同时保留该特定索引。我不能对整个列使用drop_duplicates，因为我希望在该列中保留可能只对应于'

浏览 6提问于2016-09-22得票数 1

回答已采纳

2回答

SQL中的重复数据

mysql、sql、database

我必须在我的数据库中保留重复的数据，所以我的问题is...Is最好将重复的数据保存在同一个表中，并只添加一列来标识原始数据，或者我必须创建另一个表来保存复制的数据？

浏览 15提问于2016-08-06得票数 3

2回答

基于重复列值的熊猫数据过滤- Python

python、pandas、dataframe

因此，我有一个这种类型的数据框架： Alex 10 40 20 11 5012 50 15 43 John 50 15 100 8 21 我试图只保留所有唯一行值都具有重复值的列例如，<

浏览 6提问于2022-11-17得票数 1

回答已采纳

1回答

根据除一个以外的条件忽略重复项

sql、ms-access、distinct

我有一个表在微软的访问，每天都会更新。我需要根据保单编号删除在同一开始日期内发布的所有重复项，但只保留survey_number列中编号最高的一条记录。例如，在下面的屏幕截图中，我们在同一开始日期有两个保单编号为"4204556734“的记录，我希望删除排名较差的行，并保留<

浏览 6提问于2020-02-21得票数 1

回答已采纳

1回答

删除重复项并保留最上面的值

excel、excel-formula、duplicates

在我的电子表格中，我已经将两列数据合并为一列，并对它们进行了颜色编码。列表中大约有300个重复项。如何删除重复项并保留最上面的值？使用删除重复项或过滤器>高级过滤器(仅限唯一记录)可从两个列表(在同一列中)中删除重复项。我希望最上面的列表(我的颜色与

浏览 1提问于2013-07-12得票数 3

回答已采纳

3回答

我在数据集中有重复的I，并且希望跨数据列保留NAs数量最少的I

r、duplicates、na

我有一个具有重复IDS的数据帧。我希望保留具有最少NAs数量的ID (因此，该ID的设置最完整)。在本例中，我希望保留第二个123和第二个124 (租借NAs)以下是示例数据

浏览 1提问于2021-05-16得票数 1

1回答

使用python中的两个条件过滤数据

python、pandas、numpy、filter

我想使用两种不同的条件过滤数据。但我想省略不满足条件的行，只希望保留在A列中至少出现两次的值df1 = df[(df['A-B occurrence'] >= 3) & (df['A occurrence'] >= 2)]上面是我正在使用的代码，这是我得到的输出：因此，在A列中，1

浏览 2提问于2021-10-28得票数 1

回答已采纳

1回答

Excel VBA宏，用于根据多列删除重复行并与另一列和

excel、vba

它有A列到J列中的数据。这意味着，如果所有A到I列中的值都是重复的，则应将两行视为重复。1)将值加到J列中，J列包含数字。2)保留一

浏览 4提问于2018-03-18得票数 0

回答已采纳

1回答

使用dplyr从向量列中删除NA元素

r、dplyr、purrr、pmap

我试图将列合并成一个列，我使用pmap将它们组合在一起。有些列有NAs，我希望从合并的列col_comb中删除NAs，并保留其他值。

浏览 3提问于2021-03-24得票数 1

回答已采纳

1回答

删除googlesheet中的重复值

google-apps-script、google-sheets

如何水平删除google工作表中的重复值。如果这些值是重复的，我如何删除它们并且只保留一个值。只保留第一个值，并删除所有给定电子表格中重复的第二个值。有重复的值作为水平显示，如何删除它

浏览 6提问于2022-01-18得票数 0

2回答

删除与特定字符串对应的行，但保留NA值。

r、subset、na

当特定列中的行对应于一个字符串时，我希望删除数据帧中的所有行，但保留NAs：当数据的第一列具有名为" string“的字符串值时，将删除数据帧中的所有行。但是我的第一列也有缺失的值-- NA s，所以当我使用df <- df[df$Col1!="

浏览 1提问于2020-09-13得票数 1

回答已采纳

2回答

组合两个表的最佳方法，删除重复项，但在SQL中保留所有其他非重复值。

sql、join、google-bigquery、union

我正在寻找将两个表组合在一起的最佳方法，这种方式将删除基于电子邮件的重复记录，并优先使用“表2”中的值替换任何重复，我已经考虑了完全外部联接和UNION ALL ( Union all )将太大，因为每个表都有几个1000列。我希望创建这个组合表作为我的完整引用表，并将其保存为视图，这样我就可以引用它，而不必总是在我已经很复杂的语句中添加这样的联合或类似的内容。根

浏览 2提问于2021-12-01得票数 1

回答已采纳

5回答

在MSSQL中删除重复项

sql、sql-server、duplicates、sql-delete

在MSSQL表中，我有3列。我有多个重复的KeptValue。我需要删除所有的重复项并保留1个。但我需要保留花费最多的那个。我已经创建了2个视图。重复的保留值列表VW_DUPLICATE1。

浏览 0提问于2013-07-09得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云