我对R很陌生,尝试了很多东西,但都不起作用。我的表看起来像这样:
data temp
11.01.15 11am 15
11.01.15 12am 16
11.01.15 13am 14
12.01.15 11am 13
12.01.15 12am 11
12.01.15 13am 11
它持续了5192行和很多天,我必须计算当天的平均值,测量总是一天做3次。所以我需要一个循环来计算行1-3,4-6,7-9等值的平均值,并跟踪它们并保存在文件中。
发布于 2015-04-17 07:02:50
如果你总是有3个观测值,你可以通过一个3的模块来计算temp
的平均值。
tapply(df$temp, cumsum(seq(nrow(df)) %% 3 == 1L), mean)
# 1 2
# 15.00000 11.66667
另一种方法是将data
转换为Date
类,并在其上计算平均值。下面是一个使用data.table
的示例
library(data.table)
setDT(df)[, mean(temp), by = as.Date(data, "%d.%m.%y")]
# as.Date V1
# 1: 2015-01-11 15.00000
# 2: 2015-01-12 11.66667
发布于 2015-04-17 06:58:03
使用dplyr
包及其函数。我将猜测你有一个名为"day“或"date”的变量,还有另一个变量"x“,你想让它表示每天的值。代码:
group_by(data, day) %>%
summarize(meanX = mean(x))
将返回名为data
的数据集中每一天的平均值为x的数据帧。
发布于 2015-04-17 07:22:02
您可以使用lapply来完成此操作
req.out = do.call(rbind,
lapply(split(data, f = data$date),
function(x){
out = mean(x$measurement)
}))
其中,data是您的数据框,其中包含日期和需要计算平均值的列(我将其称为上面的度量)。
https://stackoverflow.com/questions/29687343
复制相似问题