这两种形式的用法和参数含义如下:
# 基于类似数据框x的数值聚合
aggregate(x, by, FUN, ..., simplify = TRUE, drop = TRUE)
# 基于公式formula...的数值聚合
aggregate(formula, data, FUN, ...,
subset, na.action = na.omit)
x:指定待分组聚合的数值型数据,可以是向量也可以是数据框...;
by:指定分组变量,必须以列表的形式传递,如by = list(variable);
FUN:指定分组聚合的统计函数,可以是R自带的函数也可以是用户自定义函数;......基于sqldf函数的聚合
----
尽管aggregate函数可以非常方便地实现数据的分组聚合,但是它存在两方面的缺点,一个是无法直接对数据集中的单个数值型变量使用不同的聚合函数(除法FUN为自定义函数...:指定数据库中的哪些变量需要用作分组变量;
add:bool类型的参数,是否在已分组的数据框上再添加group_by的分组设置,默认为FALSE;summarise(.data, ...)
.data: