首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >R函数用于过滤/子集(以编程方式)在一个变量上显示多个值

R函数用于过滤/子集(以编程方式)在一个变量上显示多个值
EN

Stack Overflow用户
提问于 2015-08-29 20:11:39
回答 1查看 11K关注 0票数 2

有没有一个函数可以接受一个数据集,一个列,一个运算符,而不是几个值来评估一个条件?

代码语言:javascript
运行
复制
v1 <- c(1:3)
v2 <- c("a", "b", "c")
df <- data.frame(v1, v2)

要设置子集的选项(以编程方式)

代码语言:javascript
运行
复制
result <- df[df$v2 == "a" | df$v2 == "b", ]
result
1  1  a
2  2  b

或者,为了更强的健壮性

代码语言:javascript
运行
复制
result1 <- df[ df[[2]] == "a" | df[[2]] == "b", ]
result1
  v1 v2
1  1  a
2  2  b

或者,对于更简单的语法:

代码语言:javascript
运行
复制
library(dplyr)
result2 <- filter(df, v2 == "a" | v2 == "b")
result2
  v1 v2
1  1  a
2  2  b

(假设我可以在函数中安全地使用dplyr的filter(),对吗?)

我没有在上面包含subset(),因为已知它只用于交互用途。

在上述所有情况下,必须重复条件(v2 == "a" | v2 == "b")。

我正在寻找一个函数,我可以将一个向量传递给参数,比如c("a", "b"),因为我想传递大量的值,并自动执行这个过程。

这样的函数可能类似于:

fun(df, col = v2, operator = "|", value = c("a", "b")

谢谢

EN

Stack Overflow用户

回答已采纳

发布于 2015-08-29 20:12:55

如果要检查的元素数大于1,则可以使用%in%

代码语言:javascript
运行
复制
df[df$v2 %in% c('a', 'b'),]
#   v1 v2
#1  1  a
#2  2  b

或者,如果我们使用subset,则可以删除df$

代码语言:javascript
运行
复制
subset(df, v2 %in% c('a', 'b'))

或者是dplyr::filter

代码语言:javascript
运行
复制
filter(df, v2 %in% c('a', 'b'))

这可以封装在一个函数中

代码语言:javascript
运行
复制
f1 <- function(dat, col, val){
 filter(dat, col %in%  val)
 }

f1(df, v2, c('a', 'b'))
#  v1 v2
#1  1  a
#2  2  b

如果我们需要使用==,我们可以循环vector以在list中进行比较,并结合使用Reduce|

代码语言:javascript
运行
复制
df[Reduce(`|`, lapply(letters[1:2], `==`, df$v2)),]
票数 4
EN
查看全部 1 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/32285894

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档