文章/答案/技术大牛

发布

社区首页 >问答首页 >选择与向量匹配的列，并使用它们的内容创建ifelse条件

问选择与向量匹配的列，并使用它们的内容创建ifelse条件
EN

Stack Overflow用户

提问于 2022-02-15 09:47:51

回答 1查看 49关注 0票数 1

我有一个多个疾病的数据集，0表示没有这种疾病，1有这种疾病。

举个例子来说明:我对疾病A感兴趣，以及数据集中的人是自己有这种疾病，还是作为另一种疾病的原因。因此，我希望创建一个新的变量"Type“，其值为"NotDiseasedWithA”、“主”和“备用”。可导致A的疾病包含在载体“SecondaryCauses”中：

SecondaryCauses = c("DiseaseB", "DiseaseD")

"NotDiseasedWithA“指的是他们没有疾病A。“初级”指的是他们患有A型疾病，但没有任何已知的可引起这种疾病的疾病。“二级”指的是他们有A病和可能引起这种疾病的疾病。

样本数据

ID  DiseaseA    DiseaseB    DiseaseC    DiseaseD    DiseaseE
1   0           1           0           0           0
2   1           0           0           0           1
3   1           0           1           1           0
4   1           0           1           1           1
5   0           0           0           0           0

我的问题是：

如何选择我感兴趣的列？我有20多列没有排序。因此，我创建了向量。
，如何根据我感兴趣的疾病的内容创建条件？

我尝试了以下几种方法，但这不起作用：

DF %>% mutate(Type = ifelse(DiseaseA == 0, "NotDiseasedWithA", ifelse(sum(names(DF) %in% SecondaryCauses) > 0, "Secondary", "Primary")))

最后，我想得到这样的结果：

ID  DiseaseA    DiseaseB    DiseaseC    DiseaseD    DiseaseE    Type
1   0           1           0           0           0           NotDiseasedWithA
2   1           0           0           0           1           Primary
3   1           0           1           1           0           Secondary
4   1           0           1           1           1           Secondary
5   0           0           0           0           0           NotDiseasedWithA

if-statement

dplyr

回答 1

Stack Overflow用户

回答已采纳

发布于 2022-02-15 10:54:04

使用 data.table

df <- structure(list(ID = 1:5, DiseaseA = c(0L, 1L, 1L, 1L, 0L), DiseaseB = c(1L, 
0L, 0L, 0L, 0L), DiseaseC = c(0L, 0L, 1L, 1L, 0L), DiseaseD = c(0L, 
0L, 1L, 1L, 0L), DiseaseE = c(0L, 1L, 0L, 1L, 0L)), row.names = c(NA, 
-5L), class = c("data.frame"))

library(data.table)

setDT(df) # make it a data.table

SecondaryCauses = c("DiseaseB", "DiseaseD")

df[DiseaseA == 0, Type := "NotDiseasedWithA"][DiseaseA == 1, Type := ifelse(rowSums(.SD) > 0, "Secondary", "Primary"), .SDcols = SecondaryCauses]

df

#    ID DiseaseA DiseaseB DiseaseC DiseaseD DiseaseE             Type
# 1:  1        0        1        0        0        0 NotDiseasedWithA
# 2:  2        1        0        0        0        1          Primary
# 3:  3        1        0        1        1        0        Secondary
# 4:  4        1        0        1        1        1        Secondary
# 5:  5        0        0        0        0        0 NotDiseasedWithA

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/71124276

复制

相似问题

问选择与向量匹配的列，并使用它们的内容创建ifelse条件
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问选择与向量匹配的列，并使用它们的内容创建ifelse条件EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问选择与向量匹配的列，并使用它们的内容创建ifelse条件
EN