使用Dplyr "group_by“和"Summarise”及自定义函数计算多组模式

Dplyr是一个在R语言中用于数据处理和操作的强大包。它提供了一组简洁而一致的函数，可以轻松地对数据进行筛选、排序、分组、汇总等操作。

在使用Dplyr的"group_by"和"summarise"函数时，可以通过自定义函数来计算多组模式。下面是一个完善且全面的答案：

"group_by"函数：该函数用于按照指定的变量对数据进行分组。它可以接受一个或多个变量作为参数，并将数据按照这些变量的取值进行分组。
"summarise"函数：该函数用于对分组后的数据进行汇总计算。它可以接受一个或多个汇总函数作为参数，如"sum"、"mean"、"max"等，用于计算每个分组的汇总结果。
自定义函数：除了内置的汇总函数，我们还可以自定义函数来进行特定的计算。自定义函数可以是任何能够接受向量作为输入并返回单个值的函数。

使用Dplyr的"group_by"和"summarise"函数结合自定义函数，可以实现对多组模式的计算。例如，我们有一个包含学生姓名、科目和成绩的数据集，我们想要计算每个学生在每个科目上的平均成绩和总成绩。

首先，我们使用"group_by"函数将数据按照学生姓名和科目进行分组：

grouped_data <- data %>% group_by(姓名, 科目)

然后，我们使用"summarise"函数结合自定义函数来计算每个分组的平均成绩和总成绩。假设我们自定义了一个函数"calculate_avg"来计算平均成绩，一个函数"calculate_sum"来计算总成绩：

result <- grouped_data %>% summarise(平均成绩 = calculate_avg(成绩), 总成绩 = calculate_sum(成绩))

在上述代码中，"calculate_avg"和"calculate_sum"是自定义的函数，它们接受一个向量作为输入，并返回计算结果。通过"summarise"函数，我们可以将这些自定义函数应用到每个分组上，得到每个学生在每个科目上的平均成绩和总成绩。

对于这个问题，腾讯云没有直接相关的产品或产品介绍链接地址。但是，腾讯云提供了一系列云计算服务，如云服务器、云数据库、云存储等，可以帮助用户构建和管理云计算环境。用户可以根据自己的需求选择适合的腾讯云产品来支持他们的云计算需求。

相关·内容

dplyr数据处理

等函数进行模式匹配。...mtcars %>% dplyr::sample_n(10) mtcars %>% dplyr::sample_frac(0.2) 六、创建新变量有时需要对已有变量进行重新计算，例如计算几列的和.../People) 七、统计使用 summarise()可以对每一列单独进行计算，例如求和，求平均值等，这些都可以使用apply 系列函数来完成，summarise()一般都配合 group_by...分组统计：group_by()函数与 summarise()配合一起使用，可以进行分组统计。...x %>% summarise(sum(Income)) x %>% group_by(Province) %>% summarise(length(Income)) x %>% group_by(Province

1.5K1 0

Day6生信入门—R包

下面以dplyr为例，学习R包安装和加载R包初级模式通过options()$repos检验升级模式为了保证可以自定义CRAN和Bioconductor的下载镜像，只需要运行这两行代码即可：...3.加载 library和require，两个函数均可。使用一个包，是需要先安装再加载，才能使用包里的函数。...") library(dplyr) 示例数据直接使用内置数据集iris的简化版: test <- iris[c(1:2,51:52,101:102),] dplyr五个基础函数注意，井号开头的是代码运行记录...()：汇总对数据进行汇总操作, 结合 group_by 使用实用性强 summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length...的平均值和标准差先按照Species分组，计算每组Sepal.Length的平均值和标准差: group_by(test, Species) summarise(group_by(test, Species

5442 0

「R」dplyr 列式计算

❝在近期使用「dplyr」进行多列选择性操作，如 mutate_at() 时，发现文档提示一系列的「dplyr」函数变体已经过期，看来后续要退休了，使用 across() 是它们的统一替代品，所以最近抽时间针对性的学习和翻译下...（如果你想要计算每一行 a, b, c, d 的均值，请看行式计算一文）本文将向你介绍 across() 函数，它可以帮助你以更加简洁的方式重写上述代码： df %>% group_by(g1,...下面是联合 across() 和它最喜欢的动词函数 summarise()的一些例子。但你也可以联合 across() 和任意其他的「dplyr」动词函数，我们后面会提及。..._if, _at, _all 「dplyr」以前的版本允许以不同的方式将函数应用到多个列：使用带有_if、_at和_all后缀的函数。这些功能解决了迫切的需求而被许多人使用，但现在被取代了。...」的开发者们通过 across() 简化了「dplyr」对于一些数据复杂操作的处理逻辑，提高了整体的学习和使用效率，让我们使用者更关注于逻辑而非实现上。

2.4K1 0

R 数据整理（七：使用tidyr和dplyr处理数据框 2.0）

我们可以使用tidyverse 系统来操作，其中包括了magrittr 包，readr 包，dplyr 包和 tidyr 包等。...比如，需要对 cancer 数据集中 v0 和 v1 两个变量同时计算平均值和标准差: 显然，如果有许多变量要计算不止一个统计量，就需要人为地将每一个变量的每一个统计量单独命名。...dplyr 包的 summarse_at() 函数可以指定一批变量名与一批统计函数，自动命名结果变量，如: d.cancer %>% summarise_at( c("v0", "v1"), list(...CO2 %>% group_by(Type) %>% summarise( + count=dplyr::n(), + mean.uptake=mean(uptake, na.rm=TRUE)...，并且传递给summarise 进行统计： > CO2 %>% group_by(Type, Plant) %>% summarise( + count=dplyr::n(), + mean.uptake

10.9K3 0

R语言分组计算，不止group_by

目录 1 dplyr包中的group_by联合summarize 1.1 group_by语法 1.2 summarise语法 1.3 group_by和summarise单变量分组计算 1.4...group_by和summarise多变量分组计算 2 ddply 2.1 ddply语法 2.2 ddply分组计算示例 3 aggregate 3.1 aggregate语法 3.2 aggregate......为计算函数，可以是一个也可以是多个，多个的话以逗号分割summarise(data,disp = mean(disp),hp = mean(hp)) summarise计算函数Useful functions...Useful functions拓展中英语不解释了，应该懂得 1.3 group_by和summarise单变量分组计算示例 > library(dplyr) #加载dplyr包 > by_cyl 和summarise多变量分组计算示例 > mtcars %>% group_by(vs, am) %>% summarise(n = n()) # A tibble: 4 x 3 # Groups:

8.2K5 0

R数据科学|5.5.2内容介绍及课后习题解答

使用dplyr： diamonds %>% count(color, cut) #> Source: local data frame [35 x 3] #> Groups: color [?]...geom_tile()函数和填充图形属性进行可视化表示： diamonds %>% count(color, cut) %>% ggplot(mapping = aes(x = color, y =...cut)) + geom_tile(mapping = aes(fill = n)) 【注】如果分类变量是无序的，那么可以使用seriation包对行和列同时进行重新排序，以便更清楚地表示出有趣的模式...同理可计算颜色在切割质量间的分布： diamonds %>% count(color, cut) %>% group_by(cut) %>% mutate(prop = n / sum(n)...问题二使用geom_tile()函数结合 dplyr 来探索平均航班延误数量是如何随着目的地和月份的变化而变化的。为什么这张图难以阅读？如何改进？

1.9K3 0

分组统计你只想到group_by操作吗？

9943 0

R||R语言基础（三）_R包

/s/XvKb5FjAGM6gYsxTw3tcWw 03 R包及数据准备 install.packages("dplyr") library(dplyr) test <- iris[c(1:2,51:52,101...() 汇总 summarise(test, mean(Sepal.Length), sd(Sepal.Length)) #计算Sepal.Length的平均值和标准差 group_by(test,...Species) #按照Species分组 # 先按照Species分组，计算每组Sepal.Length的平均值和标准差 summarise(group_by(test, Species),mean...其核心包有ggplot、readr、tibble、purrr、 tidyr 、dplyr、ggplot、forcats 和stringr8个. 我们这里用的是dplyr包，因此可以使用管道。...test %>% group_by(Species) %>% summarise(mean(Sepal.Length),sd(Sepal.Length)) dplyr处理关系数据 01数据准备

3.4K5 0

生信学习小组day6--大姚

") library(dplyr) 示例数据采用内置数据集iris的简化版 test <- iris[c(1:2,51:52,101:102),] 二、dplyr五个基础函数 1.mutate(),新增列...()：汇总可结合group_by使用实用性更强 summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差...# 以下两条代码的意思是先按照Species分组，计算每组Sepal.Length的平均值和标准差 group_by(test, Species) summarise(group_by(test, Species...shift + M) group_by(test, Species) summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length...)) 看，通过管道可以将test中的数据直接传递给group_by函数使用，也可以将分组后的species数据传递给summarise函数使用 test %>% group_by(Species)

8180 0

Day-6 香波🐟

")library(dplyr)3.加载library()dplyr五个基础函数1.mutate(),新增列2.select(),按列筛选(1)按列号筛选(2)按列名筛选3.filter()筛选行4.arrange...()：汇总对数据进行汇总操作,结合group_by使用实用性强summary(test)#区分base包里的summary和dplyr包里的summarise函数summarise(test, mean...(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差# 先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by...(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差## mean(Sepal.Length) sd(Sepal.Length...)##1 5.916667 0.8084965# 先按照Species分组，计算每组Sepal.Length的平均值和标准差 group_by(test, Species

1681 0

Day6-学习笔记（2024年2月3日）

学习R包R包是多个函数的集合，具有详细的说明和示例，学习生信R语言必学的原因是丰富的图表和biocductor的各种生信分析R包，包的使用是一通百通的，以dplyr为例，讲解一下R包一、安装和加载R包1...3.加载R包library()和require()，两个函数均可。使用一个包，是需要先安装再加载，才能使用包里的函数。...")library(dplyr)示例数据直接使用内置数据集iris的简化版:test dplyr五个基础函数1.mutate(),新增列mutate...()：汇总,(对数据进行汇总操作,结合group_by使用实用性强)summarise(test, mean(Sepal.Length), sd(Sepal.Length))#计算Sepal.Length...的平均值和标准差先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(test, Species)

1771 0

Day6-橙子

R包本文内容均来自花花老师生信星球学习小组R包是多个函数的集合，具有详细的说明和示例。...library和require二者均可library(dplyr)安装加载三部曲R包使用流程：先安装后加载，然后才能使用包里的函数options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn...")#安装library(dplyr)#加载dplyr示例数据使用内置数据集iris的简化版赋值给变量testtest dplyr五个基础函数...()对数据进行汇总操作,结合group_by使用实用性强summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差...# 先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(test, Species),mean(

1151 0

Day6：学习R包

")library(dplyr)示例数据使用- 使用内置数据集iris的简化版test dplyr包的基本使用1. mutate函数，新增列：...()：汇总；结合group_by使用实用性强summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差#...先按照Species分组，计算每组Sepal.Length的平均值和标准差group_by(test, Species)summarise(group_by(test, Species),mean(Sepal.Length...管道操作 %>% (cmd/ctr + shift + M)test %>% group_by(Species) %>% summarise(mean(Sepal.Length), sd(Sepal.Length...bind_rows(test1, test2)- bind_cols函数bind_cols(test1, test3)

1801 0

「R」dplyr 行式计算

「原文来自：dplyr 文档」上一篇：「R」dplyr 列式计算通常 dplyr 和 R 更适合对列进行操作，而对行操作则显得更麻烦。...这篇文章，我们将学习围绕rowwise() 创建的 row-wise 数据框的 dplyr 操作方法。本文将讨论 3 种常见的使用案例：按行聚合（例如，计算 x, y, z 的均值）。...w, x, y, 和 z 的和，我们县创建一个行式数据框： rf % rowwise(id) 我们然后使用 mutate() 添加一个新的列，或者使用 summarise() 仅返回一个汇总列...它们允许你避免显式的循环和/或使用 apply() 或 purrr::map 家族函数。...do() 我们对 do()的必要性已经质疑了很长一段时间，因为它与其他 dplyr 动词并不太相似。它有两种主要的运作模式: 没有参数名：你可以调用函数来输入和输出数据框。引用“当前”组。

6.2K2 0

Day4-R包学习

具体使用哪一个是取决于你要安装的包存在于CRAN网站还是Biocductor，怎么知道存在于哪里呢？可以谷歌必应搜到的加载 library和require，两个函数均可。...使用一个包，是需要先安装再加载，才能使用包里的函数 dplyr包中函数使用 mutate() mutate(test, new = Sepal.Length * Sepal.Width) select(...(),汇总 summarise(test, mean(Sepal.Length), sd(Sepal.Length)) # 先按照Species分组，计算每组Sepal.Length的平均值和标准差 group_by...(test, Species) summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length)) dplyr包小技巧及数据处理...管道符：cmd/ctr + shift + M test %>% group_by(Species) %>% summarise(mean(Sepal.Length), sd(Sepal.Length

1231 0

常用R包-dplyr

dplyr是一个在R语言中非常流行的数据处理包，它提供了许多功能强大且易于使用的函数，包括 select、 filter、mutate、arrange和summarize 等。...这些功能使得dplyr成为数据清洗、处理和分析的首选包。...(dplyr) 二、首先创建示例数据框仍直接使用内置数据集iris，并简化 test <- iris[c(1:2,51:52,101:102),] 三、dplyr基础函数 1、filter()筛选行...()：汇总对数据进行汇总操作,结合group_by使用实用性强 summarise(test, mean(Sepal.Length), sd(Sepal.Length)) # 计算Sepal.Length...的平均值和标准差 # 先按照Species分组，计算每组Sepal.Length的平均值和标准差 group_by(test, Species) summarise(group_by(test, Species

3721 0

DAY6-学习R包

加载 library和require 使用一个R包需先安装再加载 library(dplyr）dplyr五个基础函数mutate(),新增列——mutate(test, new = Sepal.Length...()：汇总summarise(test, mean(Sepal.Length), sd(Sepal.Length))mean（）计算平均值sd（）计算标准差group_by(test, Species)...#按照Species分组并汇总summarise(group_by(test,Species),mean(Sepal.Length),sd(Sepal.Length))#按照Species分组，计算每组...Sepal.Length的平均值和标准差并汇总dplyr两个实用技能管道操作 %>% —— 相当于将左边的作为右边函数的第一个参数，快捷键: ctrl+shift+M（不管用——改为Ctrl＋a） test... %>% group_by(Species) %>% summarise(mean(Sepal.Length), sd(Sepal.Length))count统计某列的unique值count(test

2383 0

R语言包_dplyr_1

有5个基础的函数： - filter - select - arrange - mutate - summarise - group_by (plus) 可以和databases...plyr包的特点其基础函数有以下特点：第一个参数df 返回df 没有数据更改in place 正是因为有这些特点，才可以使用%>%操作符，方便逻辑式编程。...载入数据 library(plyr) library(dplyr) # load packages suppressMessages(library(dplyr)) install.packages(...flights %>% group_by(Dest) %>% summarise(avg_delay = mean(ArrDelay, na.rm=TRUE)) #summarise_each...(UniqueCarrier) %>% summarise_each(funs(mean), Cancelled, Diverted) # for each carrier, calculate

9612 0

数据处理|R-dplyr

1）安装、加载dplyr包、准备数据 install.packages("dplyr") #加载dplyr包使用dplyr包处理数据前，建议先将数据集转换为tbl对象。...Width) #计算一个或多个新列并删除原列 6）数据汇总 summarize()函数实现数据集聚合操作，将多个值汇总成一个值 summarise(iris,avg = mean(Sepal.Length...7）数据分组 group_by函数对数据进行分组后，结合summarize函数，可以对分组数据进行汇总统计。...Q：按品种分组，分别计算花萼宽度的均方差 summarise(group_by(iris,Species),sd=sd(Petal.Width)) 8）连接操作符 dplyr包里还新引进了一个操作符,%...11）数据合并 dplyr包中也添加了类似cbind()函数和rbind()函数功能的函数，它们是bind_cols()函数和bind_rows()函数。

2K1 0

R数据科学-1（dplyr）

两个软件包中的命令都可以与管道函数（％>％）很好地配合使用，这可以使代码更具可读性。详细内容可参考Cheatsheet手册。...，或者看gear不同水平下的最大值最小值，那么就用到group_by()与 summarise() 函数。...譬如，对不同gear计算mpg的均值及标准差。或者根据am及gear分组计算mpg均值标注差。...# group by gear df %>% group_by(gear) %>% summarise(mean=mean(mpg), sd=sd(mpg))...使用mutate函数。可以看到mpg1与new都变成了chr与fct。提取new，看一下。

1.6K2 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云