有很多初学者遇到的问题,写出来,更好的自我总结,正所谓:“学然后知不足,教然后知困”。以输出(写博客)倒逼输入(学习),被动学习, kill time,是一个不错的方法。...参考
https://stackoverflow.com/questions/12478943/how-to-group-data-table-by-multiple-columns
实际工作中,我们需要对数据进行平均值计算...,这里我比较了aggregate和data.table的方法,测试主要包括:
1,对数据yield计算平均值
2,计算N不同水平的平均值
3, 计算N和P不同水平的平均值
1....使用data.table方法
代码:
data(npk)
head(npk)
library(data.table)
setDT(npk)
# 单个变量
npk[,mean(yield),by=N]...# 两个变量
npk[,mean(yield),by=c("N","P")]
# 两个变量的另一种写法
npk[,mean(yield),by=list(N,P)]
npk[,mean(yield