首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从多个其他因素中快速生成因子

从多个其他因素中快速生成因子
EN

Stack Overflow用户
提问于 2021-12-16 16:36:30
回答 2查看 42关注 0票数 1

我有一个数据框架,如下所示:

代码语言:javascript
运行
复制
df <- data.frame(
  id = c(1, 2, 3, 4, 5),
  generation = as.factor(c(3, 2, 4, 3, 4)),
  income = as.factor(c(4, 3, 3, 7, 3)),
  fem = as.factor(c(0, 0, 1, 0, 1))
)

其中id是数据集中个体的标识符,generationincomefem是个体的分类特征。现在,我想根据个人特征将个人归入队列(“组”),其中对个人特征具有完全相同值的个体应该得到相同的cohort_id。因此,我希望得到以下结果:

代码语言:javascript
运行
复制
data.frame(
  id = c(1, 2, 3, 4, 5),
  generation = as.factor(c(3, 2, 4, 3, 4)),
  income = as.factor(c(4, 3, 3, 7, 3)),
  fem = as.factor(c(0, 0, 1, 0, 1)),
  cohort_id = as.factor(c(1, 2, 3, 4, 3))
)

请注意,id =3和id =5得到的cohort_id与它们具有相同的特征相同。

我的问题是,是否有一种快速的方法来创建cohort_id,而不必一次又一次地使用多个case_whenifelse?如果您想要构建许多队列,这可能会变得非常乏味。使用dplyr的解决方案很好,但没有必要。

EN

Stack Overflow用户

发布于 2021-12-16 18:15:57

以下代码将创建一个索引“cohort_id”,其值与所提供的预期值略有不同,但符合分组规则:

代码语言:javascript
运行
复制
library(dplyr)

df %>% group_by(generation, income, fem) %>%
    mutate(cohort_id = cur_group_id())%>%
    ungroup()

# A tibble: 5 × 5
     id generation income fem   cohort_id
  <dbl> <fct>      <fct>  <fct>     <int>
1     1 3          4      0             2
2     2 2          3      0             1
3     3 4          3      1             4
4     4 3          7      0             3
5     5 4          3      1             4
票数 1
EN
查看全部 2 条回答
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70382569

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档