我有两个字符向量:
x = {"a", "b", "c", "kt"}
y = {"abs", "kot", "ccf", "okt", "kk", "y"}我需要使用x从y中删除条目,以便只保留不包含x的任何条目的字符串,如下所示:
y = {"kot", "kk", "y"}该代码应该适用于任何大小的向量x和y。
到目前为止,我已经尝试使用gsub和grepl,但它们只适用于单个字符串。我试图创建一个循环来做这件事,但这个问题似乎比我想象的要困难得多。当然,解决方案越复杂越好,但你可以假设在这种情况下,向量x和y最多有200个条目。
发布于 2016-11-30 18:10:20
我们可以使用grep找出y中的哪些值与x中的模式匹配,并使用!%in%排除它们
y[!y %in% grep(paste0(x, collapse = "|"), y, value = T)]
#[1] "kot" "kk" "y" 或者使用grepl更好,因为它返回布尔向量
y[!grepl(paste0(x, collapse = "|"), y)]使用invert和value参数的grep的简明版本
grep(paste0(x, collapse = "|"), y, invert = TRUE, value = TRUE)
#[1] "kot" "kk" "y" 发布于 2016-11-30 18:13:28
@Ronak给出的答案看起来比我的答案更可取,但一种选择是使用sapply和grepl来获得与y的匹配矩阵,对于x中的每个条目,然后用另一个对apply的调用进行汇总。
> y[!apply(sapply(x, function(q) {grepl(q, y)}), 1, function(x) {sum(as.numeric(x)) > 0})]
[1] "kot" "kk" "y" 下面是我所说的匹配矩阵:
> sapply(x, function(q) { grepl(q, y) })
a b c kt
[1,] TRUE TRUE FALSE FALSE
[2,] FALSE FALSE FALSE FALSE
[3,] FALSE FALSE TRUE FALSE
[4,] FALSE FALSE FALSE TRUE
[5,] FALSE FALSE FALSE FALSE
[6,] FALSE FALSE FALSE FALSE
^^^^ each column is a match result for each element of x发布于 2016-11-30 18:49:57
这也应该是可行的:
y[Reduce("+", lapply(x, grepl, y, fixed=TRUE))==0]
# [1] "kot" "kk" "y" https://stackoverflow.com/questions/40885360
复制相似问题