首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >迭代dplyr::coalesce()

迭代dplyr::coalesce()
EN

Stack Overflow用户
提问于 2022-06-03 01:28:25
回答 2查看 42关注 0票数 1

我有一个需要使用dplyr::coalesce()的数据集。但是我想多次这样做,并且不确定什么是更有效的方法(例如循环、应用等)。

要给您一个玩具示例,假设我的数据集是:

代码语言:javascript
运行
复制
df = data.frame(
    a = c(1, NA, NA),
    a.1 = c(NA, 1, NA),
    a.2 = c(NA, NA, 1),
    b = c(2, NA, NA),
    b.1 = c(NA, 2, NA),
    b.2 = c(NA, NA, 2),
    c = c(3, NA, NA),
    c.1 = c(NA, 3, NA),
    c.2 = c(NA, NA, 3)
)

我可以这么做:

代码语言:javascript
运行
复制
new_df = df |>
    dplyr::mutate(
        a = dplyr::coalesce(a, a.1, a.2),
        b = dplyr::coalesce(b, b.1, b.2),
        c = dplyr::coalesce(c, c.1, c.2)
    ) |>
    dplyr::select(a, b, c)

这会让我:

代码语言:javascript
运行
复制
new_df
  a b c
1 1 2 3
2 1 2 3
3 1 2 3

首先,我怎样才能有效地做到这一点而不需要写很多次的合并呢?这里的例子只是一个例子,我真的需要在dataset上做40次。

还有,是否有一种方法,就像我在这里做的那样,基本上只保留a,b,c,而不是把它命名为a.1或其他什么?

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2022-06-03 01:44:44

如果列类似于somethingsomthing.etc形状,

你可以试试

代码语言:javascript
运行
复制
library(dplyr)
library(stringr)
df %>%
  split.default(str_remove(names(.), "\\..*")) %>%
  map_df(~ coalesce(!!! .x))

      a     b     c
  <dbl> <dbl> <dbl>
1     1     2     3
2     1     2     3
3     1     2     3
票数 1
EN

Stack Overflow用户

发布于 2022-06-03 01:51:10

这里有另一种选择,即旋转:

代码语言:javascript
运行
复制
library(dplyr)
library(tidyr)

df %>% 
  pivot_longer(everything()) %>% 
  mutate(name = sub("\\..*", "", name)) %>% 
  drop_na %>% 
  pivot_wider(names_from = name, values_from = value, values_fn = list) %>% 
  unnest(cols = c(a, b, c))
代码语言:javascript
运行
复制
      a     b     c
  <dbl> <dbl> <dbl>
1     1     2     3
2     1     2     3
3     1     2     3
票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/72483852

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档