首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >循环遍历多个数据集和多个列,但其中一个缺少变量

循环遍历多个数据集和多个列,但其中一个缺少变量
EN

Stack Overflow用户
提问于 2021-07-21 17:39:26
回答 1查看 23关注 0票数 0

我正在使用多个数据集(调查波),其中包括我以以下方式提取的相同变量。

首先,我创建一个函数来选择相关变量:

代码语言:javascript
运行
复制
files <- list.files(path = getwd())
tmp <- map(files, read_stata)

extractColumns <- function(x){
  select(x, "var1", "var2", "var3", "var4", "var5", "wt")
}

然后,我将该函数应用于所有数据集:

代码语言:javascript
运行
复制
df <- map(tmp,extractColumns) %>% bind_rows()

然而,"wt“变量(权重)在调查的某些迭代中并不存在。因此,我得到以下错误:

代码语言:javascript
运行
复制
 Error: Can't subset columns that don't exist.
x Column `wt` doesn't exist.
Run `rlang::last_error()` to see where the error occurred. 

因为这个变量并不包含在所有的wave中,所以我希望代码为没有这个变量的wave创建一个变量"wt“,并给这些wave中的所有受访者一个值1。

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-07-21 18:35:11

我觉得你需要dplyr::any_of

代码语言:javascript
运行
复制
myvars <- c("var1", "var2", "var3", "var4", "var5", "wt")

extractColumns <- function(x){
  select(x, any_of(myvars))
}
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/68467274

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档