有没有一个函数可以接受一个数据集,一个列,一个运算符,而不是几个值来评估一个条件?
v1 <- c(1:3)
v2 <- c("a", "b", "c")
df <- data.frame(v1, v2)要设置子集的选项(以编程方式)
result <- df[df$v2 == "a" | df$v2 == "b", ]
result
1 1 a
2 2 b或者,为了更强的健壮性
result1 <- df[ df[[2]] == "a" | df[[2]] == "b", ]
result1
v1 v2
1 1 a
2 2 b或者,对于更简单的语法:
library(dplyr)
result2 <- filter(df, v2 == "a" | v2 == "b")
result2
v1 v2
1 1 a
2 2 b(假设我可以在函数中安全地使用dplyr的filter(),对吗?)
我没有在上面包含subset(),因为已知它只用于交互用途。
在上述所有情况下,必须重复条件(v2 == "a" | v2 == "b")。
我正在寻找一个函数,我可以将一个向量传递给参数,比如c("a", "b"),因为我想传递大量的值,并自动执行这个过程。
这样的函数可能类似于:
fun(df, col = v2, operator = "|", value = c("a", "b")
谢谢
发布于 2015-08-29 20:12:55
如果要检查的元素数大于1,则可以使用%in%。
df[df$v2 %in% c('a', 'b'),]
# v1 v2
#1 1 a
#2 2 b或者,如果我们使用subset,则可以删除df$
subset(df, v2 %in% c('a', 'b'))或者是dplyr::filter
filter(df, v2 %in% c('a', 'b'))这可以封装在一个函数中
f1 <- function(dat, col, val){
filter(dat, col %in% val)
}
f1(df, v2, c('a', 'b'))
# v1 v2
#1 1 a
#2 2 b如果我们需要使用==,我们可以循环vector以在list中进行比较,并结合使用Reduce和|
df[Reduce(`|`, lapply(letters[1:2], `==`, df$v2)),]https://stackoverflow.com/questions/32285894
复制相似问题