我正在尝试理解如何在不使用循环的情况下有条件地替换数据帧中的值。我的数据框结构如下:
> df
a b est
1 11.77000 2 0
2 10.90000 3 0
3 10.32000 2 0
4 10.96000 0 0
5 9.90600 0 0
6 10.70000 0 0
7 11.43000 1 0
8 11.41000 2 0
9 10.48512 4 0
10 11.19000 0 0
dput
的输出是这样的:
structure(list(a = c(11.77, 10.9, 10.32, 10.96, 9.906, 10.7,
11.43, 11.41, 10.48512, 11.19), b = c(2, 3, 2, 0, 0, 0, 1, 2,
4, 0), est = c(0, 0, 0, 0, 0, 0, 0, 0, 0, 0)), .Names = c("a",
"b", "est"), row.names = c(NA, -10L), class = "data.frame")
我要做的是检查b
的值。如果b
为0,我希望将est
设置为a
中的一个值。我知道当为b==0
时,df$est[df$b == 0] <- 23
会将est
的所有值设置为23。我不明白的是,当条件为真时,如何将est
设置为a
的值。例如:
df$est[df$b == 0] <- (df$a - 5)/2.533
给出以下警告:
Warning message:
In df$est[df$b == 0] <- (df$a - 5)/2.533 :
number of items to replace is not a multiple of replacement length
有没有办法让我传递相关的单元格,而不是向量?
发布于 2011-11-22 00:14:08
试试data.table的:=
操作符:
DT = as.data.table(df)
DT[b==0, est := (a-5)/2.533]
它又快又短。有关:=
的更多信息,请参阅以下链接的问题:
When should I use the :=
operator in data.table
发布于 2011-11-21 23:41:47
这里有一种方法。ifelse
是矢量化的,它检查所有行中是否有b
的零值,如果是这样,则用(a - 5)/2.53
替换est
。
df <- transform(df, est = ifelse(b == 0, (a - 5)/2.53, est))
发布于 2018-06-28 16:22:19
另一种选择是使用case_when
require(dplyr)
mutate(df, est = case_when(
b == 0 ~ (a - 5)/2.53,
TRUE ~ est
))
如果需要区分两种以上的情况,这种解决方案会变得更加方便,因为它可以避免嵌套的if_else
构造。
https://stackoverflow.com/questions/8214303
复制相似问题