我的数据框架如下所示
data.1 <- data.frame(
X1 = 6:10,
X2 = 1:5,
X3 = c(TRUE,FALSE,TRUE,FALSE,TRUE)
)
X1 X2 X3
1 6 1 TRUE
2 7 2 FALSE
3 8 3 TRUE
4 9 4 FALSE
5 10 5 TRUE
我想创建一个具有以下逻辑的新列X4:
if X3==NULL then X4=NULL
elseif X3==TRUE then X4=X1+X2
else X4=X1-X2
提前感谢
发布于 2016-04-03 20:54:41
lapply
用于当数据是一个列表时,这不是您要做的事情。
首先,在NULL
中找不到data.frame
条目。NA
,当然,但不是NULL
,所以您应该使用is.na()
。接下来,您不需要测试if(x==TRUE)
;R知道如何使用if(x)
。好吧,那就谈正事吧,你大部分时间都带着你的ifelse
去了。您可以为ifelse
的输出分配一个向量,它将为您处理向量化。
data.1$X4 <- ifelse(is.na(data.1$X3),
NA,
ifelse(data.1$X3==TRUE,
data.1$X1+data.1$X2,
data.1$X1-data.1$X2))
data.1
## X1 X2 X3 X4
## 1 6 1 TRUE 7
## 2 7 2 FALSE 5
## 3 8 3 TRUE 11
## 4 9 4 FALSE 5
## 5 10 5 TRUE 15
不过,这很难看。dplyr
包括非标准的计算,这涉及到搜索列的命名空间,所以您不需要每次想引用列时都引用数据名,这样就更清晰了。dplyr::mutate
更改一列。
library(dplyr)
mutate(data.1, X4 = ifelse(is.na(X3),
NA,
ifelse(X3,
X1+X2,
X1-X2)))
data.1
## X1 X2 X3 X4
## 1 6 1 TRUE 7
## 2 7 2 FALSE 5
## 3 8 3 TRUE 11
## 4 9 4 FALSE 5
## 5 10 5 TRUE 15
https://stackoverflow.com/questions/36394605
复制相似问题