我需要计算3列中每一行的最大值。
一张桌子可以是:
x = c(1,2,3,4,5 )
y = c(2,3,3,1,1 )
z = c(4,3,2,1,1 )
df<-data.frame(x,y,z)我要得到:
x y z max
1 1 2 4 4
2 2 3 3 3
3 3 3 2 3
4 4 1 1 4
5 5 1 1 5我试过:
df$max<-max(x, y,z)但我明白:
x y z max
1 1 2 4 5
2 2 3 3 5
3 3 3 2 5
4 4 1 1 5
5 5 1 1 5那么,我如何才能正确地做到这一点呢?
发布于 2014-09-19 14:38:09
可以为此使用apply函数,如下所示:
df$max<-apply(X=df, MARGIN=1, FUN=max)MARGIN=1参数表明,对于X中的每一行,您都希望在FUN中应用该函数。如果您使用MARGIN=2,它将是by列或MARGIN=c(1,2),它将是行和列。
发布于 2014-09-19 14:20:07
使用data.table :)
library(data.table)
x = c(1,2,3,4,5 )
y = c(2,3,3,1,1 )
z = c(4,3,2,1,1 )
dt<-data.table(x,y,z)
dt[, max:=pmax(x,y,z)]
dt发布于 2014-09-19 13:53:56
尝试:
df$max <- do.call(`pmax`, df)
df
# x y z max
#1 1 2 4 4
#2 2 3 3 3
#3 3 3 2 3
#4 4 1 1 4
#5 5 1 1 5基准测试
set.seed(49)
df <- as.data.frame(matrix(sample(0:20, 1e5*3,replace=TRUE), ncol=3))
f1 <- function() df$max <- apply(df, 1, max)
f2 <- function() df$max <- do.call(`pmax`, df)
f3 <- function() setDT(df)[, max:=pmax(V1,V2,V3)]
library(microbenchmark)
microbenchmark(f1(), f2(),f3(), unit="relative", times=25)
#Unit: relative
# expr min lq median uq max neval
# f1() 48.143635 48.287875 46.031638 32.868138 8.922203 25
# f2() 1.269581 1.373479 1.654625 2.324896 1.182107 25
# f3() 1.000000 1.000000 1.000000 1.000000 1.000000 25https://stackoverflow.com/questions/25935134
复制相似问题