删除data.table列X中的一些重复项，但如果列Y符合条件，则保留重复项

在删除data.table列X中的一些重复项的同时保留符合条件的重复项时，可以使用以下步骤：

导入data.table库和相关依赖：

library(data.table)

创建一个data.table对象：

dt <- data.table(colX = c("A", "A", "B", "C", "C", "C"), colY = c(1, 2, 3, 4, 5, 6))

使用逻辑判断筛选出符合条件的重复项，并进行删除操作：

dt <- dt[, .SD[duplicated(colX) | (duplicated(colX) & colY != 2)], by = .(colX)]

这里通过duplicated(colX)获取到重复项的逻辑向量，通过逻辑运算符|和&进行条件判断，筛选出符合条件的重复项。

最后，通过dt即可得到删除重复项后的data.table对象。

下面是对上述步骤的解释：

.SD代表 Subset of Data，用于在by分组的情况下进行数据子集操作。
duplicated(colX)返回一个逻辑向量，表示colX中是否有重复项。
duplicated(colX) & colY != 2表示同时判断colX是否重复并且colY不等于2的条件。
by = .(colX)指定按照colX进行分组。

根据这个问答内容，我给出了解决问题的完整代码，并且使用了data.table库进行操作。data.table是一个功能强大且高效的R语言扩展包，适用于大规模数据集的处理。

腾讯云提供了云计算服务，其中包括云数据库、云服务器、云原生应用等，可以根据实际需求选择适合的产品。具体可参考腾讯云官方网站提供的产品介绍页面：腾讯云产品介绍

请注意，我不会提及其他云计算品牌商，但你可以自行了解并选择最适合你的云计算平台。

删除data.table列X中的一些重复项，但如果列Y符合条件，则保留重复项

、

我不想保留列中的值与某个条件匹配的data.table的第一行，而是希望保留列中的值与主条件匹配的所有行，或者，如果列中的值与次要条件匹配，则只保留一行，但一个值优先于另一个值。想象一下data.

浏览 15提问于2020-01-21得票数 2

回答已采纳

3回答

基于另一列删除列中的重复项

、、、

我正在寻找一种更好的方法在R中实现这一点，我确实有一个可能性，但它似乎应该有一个聪明的/更易读的方式。我想删除一个/多个列中的重复项，只有在另一列(或多列)满足条件时才删除。在我的简化示例中，只有当列X是NA时，我才希望删除列<

浏览 0提问于2018-06-22得票数 2

回答已采纳

2回答

在多个条件下删除重复行

、

我有一个包含重复行的数据框。一些列有数据，另一些列有零。我希望保留包含数据的行，并删除那些包含零的行，但我还希望在只有零的情况下删除重复的行。下面是一个例子x 0y 0z 1A By</

浏览 11提问于2018-02-13得票数 0

回答已采纳

2回答

根据条件awk/bash删除重复

、、

我想从有3列的数据集中删除重复项。A 0 3238C 0 3130我需要删除第三列中包含重复值的行，但优先保留第二列中值'1‘的行。我知道如何使用awk删除重复项，但我无法解决如何

浏览 5提问于2013-08-26得票数 0

回答已采纳

3回答

Excel VBA -删除副本并保留最新的(基于日期列)

、

我想要创建一个宏，删除重复项(基于A列)，并保留具有最新日期的行(P列)。如果所有副本在P列中都没有日期，只需保留一个，然后删除其他副本。该表通常

浏览 7提问于2016-08-18得票数 2

1回答

有条件地删除重复的pandas python

、、、、

有没有办法有条件地在大约10列和400,000行的pandas数据框中删除重复项(特别是使用drop_duplicates )？也就是说，我希望所有有2列的行都满足一个条件:如果date (column)和store (column) #的组合是唯一的，则保留行，否则删除。

浏览 1提问于2015-05-03得票数 8

1回答

删除基于2列的重复项，但保留第3列不为空的行

我有一个在名称和日期上有一些重复的数据集，但是第三列有一个数字或NULL值，当删除重复时，我想使条件保留在第三列中的not NULL值我希望所有的空值都是蓝色的，所以你可以看到，我并不想去掉所有的空值如果我突出显示日期和名称列并删除重复项，它将保留第一个，并且没有

浏览 1提问于2021-04-30得票数 0

1回答

使用partion和where子句删除表中的重复项

、

使用SQL Server 2016 我发现，在大型表中复制行时，使用分区覆盖行的方法是最快的。我正在尝试使用相同的过程来删除一些重复项，但现在我有了独特的情况。基本上，我需要删除在除一列之外的所有列上重复的行。但是，如果排除的列也被复制，则允许复制行，但<e

浏览 13提问于2019-03-21得票数 0

1回答

清除R dataframe中的列中的重复项

、

我有一个数据帧，其中包括三列中的重复项： Name Year Job1 Job2 Job3Henry 2010 CEO president president 我想删除每一行中"job1“、"job2”和&quo

浏览 40提问于2021-05-03得票数 2

回答已采纳

1回答

基于条件pandas删除重复项

、

删除重复项时，是否可以保留符合条件的行？而不是做： df.remove_duplicates(subset=['x','y'], keep='first'] 执行以下操作： df.remove_duplicates(subset=['x','y'], keep=df.loc[df[column]==&

浏览 8提问于2021-11-19得票数 1

回答已采纳

1回答

仅根据某些列选择唯一行

、

我有一个SQL视图，我希望只基于某些列获得唯一的行。如果所有其他列都相同(不包括A)，则必须删除重复项。如果所有其他列(B除外)相同，则必须删除重复项。我使用了下面的代码，但它仍然给出了A的最大值，然后给出了B的最大值，我想要得到不同的行，不包括这两列，我希望将这些

浏览 2提问于2022-03-02得票数 0

1回答

根据另一个列值删除excel中的重复项

我的excel值如下(A和B列)： ? 现在，如果有任何重复项的值为零(在B列中)，我希望删除A列中的重复项。所以对于上面的例子，我应该只保留a和b。但是对于所有的c，它应该被删除。我的if条件出了什么问题？谢谢。

浏览 13提问于2020-03-23得票数 1

回答已采纳

2回答

根据条件删除不同的值

、

我有一个数据集，我试图删除重复的值，但需要保留符合条件的行。看上去，a NAb 1d 1如果只运行正常的不同函数，则只保留重复项的第一个值/行。>% top_n(1, co

浏览 8提问于2022-07-22得票数 1

回答已采纳

1回答

如何根据一列中的重复项修改另一列并在Excel中保留唯一值

、

我有一个电子表格，其中有许多重复项我需要清理，但需要确保另一列中的正确数据被保留。数据和预期结果 ? 基本上，在E列中有重复的值，但这些值可以重复任意次，每次都不是相同的数量。在D列中，每条记录都应该有一个A或B或空白。现在的问题是，一些重复的集

浏览 64提问于2021-10-19得票数 0

2回答

如果另一列中的值为null - Pandas，则删除重复。

、、

我所拥有的：Name |Vehicle Mark |BikeDave |我想从Name列中删除重复项，但只有在Vehicle列中的相应值为我知道我可以用对于任何一个Keep =，或者'First' or 'Last'，但是我要寻找<e

浏览 4提问于2019-12-30得票数 5

回答已采纳

1回答

如何在Excel 2010中删除单列中的重复项

、、

我们有一个相当大的电子表格，其中可能有许多重复项。我正在尝试找到一种方法来突出显示和删除单个列中的重复项-例如，B列用于电子邮件地址。一个人的电子邮件应该只出现一次，所以如果他们在B列中出现的次数更多，那么X行就是重复的信息。行X可能包含B列中</

浏览 1提问于2016-12-06得票数 0

1回答

excel:按3列检查重复行，保留一行

、

这可能是一个有点多的要求，但我想知道以下是否可能。这都是基于我在上的初始问题我有一个工作表，其中包含大约12列相同类型的数据被复制到其中，这意味着两行或更多行可能包含完全相同的数据，但是如果我可以检查重复，它将基于3个特定的列。我不想对此任务使用AutoFilter或条件格式，因为工作表可能包含数百到数千行，而我希望能够找到重复项，删除它们并只保留</e

浏览 0提问于2014-02-09得票数 2

回答已采纳

1回答

我在hibernate的postgresql数据库中插入了大量包含电话号码和状态(一百万)的记录。我正在从一个文件中读取记录，处理每个记录，然后一次插入一个记录。但是在插入之前，我需要检查这个电话号码和状态的组合是否已经存在于表中。在我看来，最快的方法是执行查询并将其限制为1，或者是Exists查询，但我从同事那里得到的另一个建议是在表中的电话号码和状态字段上添加一个唯一约束，如果唯一键规则被违反，

浏览 1提问于2014-07-01得票数 0

1回答

基于其他列中的值在Excel中编写条件删除重复项语句

、、

我正在尝试根据其他列中的值删除/压缩列中的重复行。我尝试做的是让Excel在A列中发现重复项，然后在这组重复项中，删除B和C列中不包含特定值(x)的项，并将B和C列中<e

浏览 3提问于2021-07-08得票数 0

2回答

SSIS条件拆分

、、、、

我正在将一组数据导入到OLE DB SQL服务器中。G123453 A11111 G23456我必须删除重复项，并通过转换上传表。如果condition列重复项具有相同的值，则接受该值，如果不同，则接受较小的值。与client列</em

浏览 1提问于2014-04-01得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

删除data.table列X中的一些重复项，但如果列Y符合条件，则保留重复项

相关·内容

删除data.table列X中的一些重复项，但如果列Y符合条件，则保留重复项

基于另一列删除列中的重复项

在多个条件下删除重复行

根据条件awk/bash删除重复

Excel VBA -删除副本并保留最新的(基于日期列)

有条件地删除重复的pandas python

删除基于2列的重复项，但保留第3列不为空的行

使用partion和where子句删除表中的重复项

清除R dataframe中的列中的重复项

基于条件pandas删除重复项

仅根据某些列选择唯一行

根据另一个列值删除excel中的重复项

根据条件删除不同的值

如何根据一列中的重复项修改另一列并在Excel中保留唯一值

如果另一列中的值为null - Pandas，则删除重复。

如何在Excel 2010中删除单列中的重复项

excel:按3列检查重复行，保留一行

Postgresql检查表中是否存在唯一约束

基于其他列中的值在Excel中编写条件删除重复项语句

SSIS条件拆分

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐