在group_by()中计算dplyr中两组不同列的累积和

在dplyr中，group_by()函数用于按照指定的列对数据进行分组。而计算两组不同列的累积和可以通过summarize()函数结合mutate()函数来实现。

首先，使用group_by()函数按照需要分组的列进行分组，然后使用summarize()函数计算每个组的累积和。在summarize()函数中，可以使用mutate()函数来创建一个新的列，该列存储每个组的累积和。

以下是一个示例代码：

library(dplyr)

# 假设有一个数据框df，包含两列A和B
df <- data.frame(A = c(1, 2, 3, 1, 2, 3),
                 B = c(4, 5, 6, 4, 5, 6))

# 使用group_by()函数按照列A进行分组，并计算列B的累积和
result <- df %>%
  group_by(A) %>%
  summarize(CumulativeSum = sum(B)) %>%
  mutate(CumulativeSum = cumsum(CumulativeSum))

# 输出结果
print(result)

在上述代码中，首先使用group_by(A)对数据框df按照列A进行分组。然后使用summarize()函数计算每个组的列B的和，并将结果存储在新的列CumulativeSum中。接下来，使用mutate()函数结合cumsum()函数计算CumulativeSum列的累积和。

这样，我们就得到了按照列A分组的每个组的累积和。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，无法给出具体的推荐产品和链接地址。但是可以根据实际需求选择适合的云计算平台或服务提供商来实现相应的功能。

整理数据的本质可以归纳为：对数据进行分割（Split），然后应用（Apply）某些处理函数，最后将结果重新组合（Combine）成所需的格式返回，简单描述为：Split - Apply - Combine。plyr包是Hadley Wickham为解决split – apply – combine问题而写的一个包。使用plyr包可以针对不同的数据类型，在一个函数内同时完成split – apply – combine三个步骤。plyr包的主函数是**ply形式的，函数名的第一个字符代表输入数据的类型，第二个字符代表输出数据的类型，其中第一个字符可以是(d、l、a)，第二个字母可以是(d、l、a、_ )，不同的字母表示不同的数据格式，d表示数据框格式，l表示列表，a表示数组，_则表示没有输出。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在group_by()中计算dplyr中两组不同列的累积和

相关·内容

生信代码：数据处理（ tidyverse包）

Python从零开始第三章数据处理与分析python中的dplyr（5）目录

「R」数据操作（七）：dplyr 操作变量与汇总

快速掌握R语言中类SQL数据库操作技巧

tidyverse：R语言中相当于python中pandas+matplotlib的存在

懒癌必备-dplyr和data.table让你的数据分析事半功倍

R语言︱数据集分组、筛选(plit – apply – combine模式、dplyr、data.table)

数据清洗与管理之dplyr、tidyr

数据处理|R-dplyr

【R语言】基础知识|dplyr管道函数处理表格

R︱高效数据操作——data.table包（实战心得、dplyr对比、key灵活用法、数据合并）

左手用R右手Python系列6——变量计算与数据聚合

R数据科学|3.6内容介绍

两个神奇的R包介绍，外加实用小抄

R入门？从Tidyverse学起！

玩转数据处理120题｜R语言版本

数据处理的R包

「Workshop」第二期：程序控制与数据操作流

分组统计你只想到group_by操作吗？

R语言分组计算，不止group_by

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐