文章/答案/技术大牛

发布

社区首页 >问答首页 >从字符串向量中删除包含R中特定字符的条目

问从字符串向量中删除包含R中特定字符的条目
EN

Stack Overflow用户

提问于 2016-11-30 18:03:20

回答 3查看 14.5K关注 0票数 12

我有两个字符向量：

x = {"a", "b", "c", "kt"}
y = {"abs", "kot", "ccf", "okt", "kk", "y"}

我需要使用x从y中删除条目，以便只保留不包含x的任何条目的字符串，如下所示：

y = {"kot", "kk", "y"}

该代码应该适用于任何大小的向量x和y。

到目前为止，我已经尝试使用gsub和grepl，但它们只适用于单个字符串。我试图创建一个循环来做这件事，但这个问题似乎比我想象的要困难得多。当然，解决方案越复杂越好，但你可以假设在这种情况下，向量x和y最多有200个条目。

grepl

string

character

gsub

回答 3

Stack Overflow用户

回答已采纳

发布于 2016-11-30 18:10:20

我们可以使用grep找出y中的哪些值与x中的模式匹配，并使用!%in%排除它们

y[!y %in% grep(paste0(x, collapse = "|"), y, value = T)]

#[1] "kot" "kk"  "y"

或者使用grepl更好，因为它返回布尔向量

y[!grepl(paste0(x, collapse = "|"), y)]

使用invert和value参数的grep的简明版本

grep(paste0(x, collapse = "|"), y, invert = TRUE, value = TRUE)
#[1] "kot" "kk"  "y"

票数 20

Stack Overflow用户

发布于 2016-11-30 18:13:28

@Ronak给出的答案看起来比我的答案更可取，但一种选择是使用sapply和grepl来获得与y的匹配矩阵，对于x中的每个条目，然后用另一个对apply的调用进行汇总。

> y[!apply(sapply(x, function(q) {grepl(q, y)}), 1, function(x) {sum(as.numeric(x)) > 0})]
[1] "kot" "kk"  "y"

下面是我所说的匹配矩阵：

> sapply(x, function(q) { grepl(q, y) })
         a     b     c    kt
[1,]  TRUE  TRUE FALSE FALSE
[2,] FALSE FALSE FALSE FALSE
[3,] FALSE FALSE  TRUE FALSE
[4,] FALSE FALSE FALSE  TRUE
[5,] FALSE FALSE FALSE FALSE
[6,] FALSE FALSE FALSE FALSE
       ^^^^ each column is a match result for each element of x

票数 4

Stack Overflow用户

发布于 2016-11-30 18:49:57

这也应该是可行的：

y[Reduce("+", lapply(x, grepl, y, fixed=TRUE))==0]
# [1] "kot" "kk"  "y"

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/40885360

复制

相似问题

问从字符串向量中删除包含R中特定字符的条目
EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从字符串向量中删除包含R中特定字符的条目EN

回答 3

Stack Overflow用户

Stack Overflow用户

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问从字符串向量中删除包含R中特定字符的条目
EN