在R中自动分组和汇总

在R中，可以使用多种方法实现自动分组和汇总的操作。以下是一些常用的方法：

使用dplyr包进行分组和汇总：
- 概念：dplyr是一个用于数据处理的R包，提供了一组简洁且一致的函数，用于对数据进行分组、筛选、汇总等操作。
- 分类：数据处理工具包。
- 优势：语法简洁易懂，功能强大，适用于大规模数据处理。
- 应用场景：数据清洗、数据分析、数据可视化等。
- 推荐的腾讯云相关产品：无。
- 示例代码：
- 示例代码：

使用data.table包进行分组和汇总：
- 概念：data.table是一个用于高效处理大型数据集的R包，提供了一组快速且灵活的函数，用于对数据进行分组、筛选、汇总等操作。
- 分类：数据处理工具包。
- 优势：速度快，内存占用低，适用于大规模数据处理。
- 应用场景：大数据处理、数据清洗、数据分析等。
- 推荐的腾讯云相关产品：无。
- 示例代码：
- 示例代码：
使用base R进行分组和汇总：
- 概念：base R是R语言的核心功能，提供了一组基本的函数和数据结构，用于对数据进行分组、筛选、汇总等操作。
- 分类：基础功能。
- 优势：无需额外安装包，适用于简单的数据处理任务。
- 应用场景：数据处理、数据分析、统计建模等。
- 推荐的腾讯云相关产品：无。
- 示例代码：
- 示例代码：

以上是在R中实现自动分组和汇总的几种常用方法。根据具体的需求和数据规模，可以选择适合的方法进行操作。

页面内容是否对你有帮助？

有帮助

没帮助

按组划分列(在数据帧中分组)

我想通过将每个响应/列除以其组均值来计算相对响应值。我成功地提出了一种详尽的(因而令人不满意)的方法。我的数据集非常大，包含多个组和响应。 ############### # example # used packages require(plyr) # sample data group <- c(rep("alpha", 3), rep("beta", 3), rep("gamma", 3)) a <- rnorm(9, 10,1) #some random data as response b <- rnorm(9,

浏览 0提问于2015-01-13得票数 3

回答已采纳

13回答

如何获取分组汇总统计数据

、

我正在尝试在R/S+中获得多个汇总统计信息，并按分类列一次分组。我找到了几个函数，但所有这些函数都对每个调用执行一个统计数据，比如aggregate()。 data <- c(62, 60, 63, 59, 63, 67, 71, 64, 65, 66, 68, 66, 71, 67, 68, 68, 56, 62, 60, 61, 63, 64, 63, 59) grp <- factor(rep(LETTERS[1:4], c(4,6,6,8))) df <- data.frame(group=grp, dt=data) mg <- aggre

浏览 8提问于2012-03-24得票数 88

2回答

在求和前对R数据进行多次分组

、、、

在提供显示每个组内值之和的汇总表之前，我试图将数据按多个变量分组。我已经创建了以下数据作为一个例子。 Value <- c(21000,10000,50000,60000,2000, 4000, 5500, 10000, 35000, 40000) Group <- c("A", "A", "B", "B", "C", "C", "A", "A", "B", "C") Type <- c(1, 2, 1, 2,

浏览 3提问于2017-09-19得票数 1

回答已采纳

4回答

R中的Groupwise计算

、、、

我已经对R中的一个数据帧进行了分组和汇总，因此我现在有一个表，如下所示： Group | Value | Count ========================== A | 1 | 4 A | 2 | 2 A | 10 | 4 B | 3 | 2 B | 4 | 4 B | 2 | 3 C | 5 | 3 C | 2 | 6 我感兴趣的是找出值2在每组中的相对频率： Group | Relative freq of 2 ======

浏览 2提问于2016-09-13得票数 2

3回答

如何用dplyr::group_by给出每组数据的编号？

、、、

我想给每个组的数据。例如，我有以下数据： df = data.frame( from = c('a', 'a', 'b'), dest = c('b', 'c', 'd') ) #> df #from dest #1 a b #2 a c #3 b d 我希望根据from值进行分组，并给每个组提供一个组号。这是预期的结果： result = data.frame( from = c('a', 'a', 'b&#

浏览 8提问于2016-03-16得票数 4

回答已采纳

3回答

R中发生的次数

对于一个样本数据： df <- structure(list(area = c("a", "b", "c", "d", "e", "f", "g", "h", "i", "j", "k"), count = c(1L, 1L, 1L, 3L, 4L, 2L, 2L, 4L, 2L, 5L, 6L)), .Names = c("

浏览 0提问于2018-03-27得票数 1

回答已采纳

2回答

R:如何根据多列标准聚合(并总结) df中的行并保持先前的顺序？

、

我希望在以下数据示例中聚合行(并汇总值)： df <- data.frame(from=c("A" ,"A", "A", "C", "C", "D", "A"), to=c("B", "B", "B", "A", "A", "B", "D"), values=c(5,6,2,10,2,6,3)

浏览 0提问于2015-10-09得票数 2

回答已采纳

2回答

查找在另外两列中具有相同值的组

、

我希望找到组A和组B在feature列和value列中具有相同值的行。我的数据： group feature value 1 A f1 1 2 B f1 1 3 A f2 1 4 B f2 0 5 A f3 0 6 B f3 1 df = data.frame(group = rep(c("A", "B"), 3), feature = c("f1",

浏览 3提问于2022-11-12得票数 4

回答已采纳

1回答

在R中的聚合后选择其他行元素

、

我想在每一组中选出最年轻的人，并按性别进行分类。这是我的初步数据 data1 ID Age Gender Group 1 A01 25 m a 2 A02 35 f b 3 B03 45 m b 4 C99 50 m b 5 F05 60 f a 6 X05 65 f a 我想要这个 Gender Group Age ID m a 25 A01 f a 60 F05 m

浏览 1提问于2015-11-27得票数 0

回答已采纳

2回答

根据值等级对数据帧进行过滤

我有一个数据框架(Df)，例如 group value a 4.2 a 4.5 a 6.2 b 5.1 b 3.5 a 4.2 a 5.1 b 6.4 b 3.3 b 4.1 a 5.0 所需的输出是 group value a 4.5 a 6.2 a 5.1 a 5.0 b 5.1 b 6.4 b 4.1 即，期望输出提取每个“组”的最小2“值”。例如, 4.2和4.2是a组最小的两个值，和 3.

浏览 5提问于2015-02-22得票数 2

回答已采纳

4回答

计算组平均值、和或其他汇总统计数据。并将列分配给原始数据。

、、、、

我希望在分组变量("group")的每个级别内计算数值变量("value")的mean (或长度为1的任何其他汇总统计信息，例如min、max、length、sum)。摘要统计应该分配给一个与原始数据长度相同的新变量。也就是说，原始数据的每一行都应该有一个与当前组值相对应的值--不应将数据集折叠为每组一行。例如，考虑组mean 在此之前 id group value 1 a 10 2 a 20 3 b 100 4 b 200 之后 id group value grp.mean.values 1

浏览 3提问于2011-05-19得票数 44

1回答

R:将数据帧中组的值保持在99分位数以下

、、

我有一个包含组和值的数据格式。首先，我计算了每组99%的分位数。现在，我要删除每个组99%分位数以上的值。 df<-data.frame(group = rep(c("A", "B"), each = 4), value = c(c(6,5,80,4,60)*10,3,5,4)) # data group value 1 A 60 2 A 50 3 A 800 4 A 40 5 B 600 6 B 3 7 B 5 8

浏览 2提问于2017-11-16得票数 3

回答已采纳

2回答

如何打印要素级汇总统计数据的最小和最大值(取最小和最大中间值/比例)？

、、

我有如下数据，包括10种产品(a，b，c，.)，以及它们的描述(其他变量)。我需要报告其他变量的汇总统计量(中位数/比例)在产品之间的范围(应该作为每个汇总统计值的最小值和最大值来打印)。例如，：哪种产品的价格最低，哪种产品的中位数最高(只需要报告两个值，产品名称就不重要了)。哪种产品具有最低和最高的比例的“坏”评级(只需要报告两个值，产品名称不重要)。有一个简单的方法来编码它吗？我的实际数据有10,000个产品和150个其他变量，目瞪口呆的汇总表会让我丧命。数据 ```{r} data.frame( 产品=rep(字母1:10，每个字母= 2，次数= 500)，价格= rnor

浏览 5提问于2020-09-12得票数 0

3回答

根据预先设置的条件总结数据并添加(0,1)标志

、、

我有以下数据框架df，其中有以下列： df <- REP METRIC BE 1 A 1 2 A 0 3 A 1 1 B 1 2 B 1 3 B 1 1 C 0 2 C 1 3 C 1 我想按REP对数据进行汇总，以便对于每个唯一的REP，如果BE是Metric A和B的1，那么添加一个新的列BEBOTH和1，否则就是0 (也就是说，如果它们中的任何一个为零，那么BEBOTH为零)。产出应是： REP BEB

浏览 5提问于2016-04-19得票数 2

回答已采纳

1回答

rowDiffs类型函数，将“行1”作为每个组的参考行

假设我有一个带有分组变量的简单数据框架，每个组有三个xs： df<-data.frame(grp=rep(letters[1:3],each=3), x=rnorm(9)) grp x 1 a 1.9561455 2 a -2.3916438 3 a 0.7267603 4 b -0.8794693 5 b -0.3089820 6 b -1.7228825 7 c -0.3964017 8 c -0.6237301 9 c -0.1522535 我希望每个组将初始行作为参考行，并获得所有行的x

浏览 2提问于2015-07-28得票数 2

回答已采纳

3回答

移除R中数据集中组的顶部和底部十进制

我有一个与下面的数据相似的数据集 Type Count A 0.022496545 A 0.969600752 A 0.476144762 A 0.142649351 A 0.902891034 A 0.004099406 A 0.80460619 A 0.642014007 A 0.688212724 A 0.879709931 B 0.886410732 B 0.803057447 B 0.203613404 B 0.606411333 B 0.886645412 B 0.418132624 B 0.65350920

浏览 4提问于2017-01-23得票数 1

回答已采纳

2回答

创建组变量

我有这张数据df A B value1 a value1 b value1 c value2 a value2 b value 2 c value 2 d 我想要这样的东西 A B group value1 a 1 value1 b 1 value1 c 1 value2 a 2 value2 b 2 value2 c 2 value2 d 2 也就是说，我想创建一个变量，对相同的A值进行分组。你怎么说这是最好的方法？示例 id code

浏览 0提问于2016-04-01得票数 0

回答已采纳

3回答

在数据帧中提取每个组内的最大值

、

我有一个数据框，包含一个分组变量("Gene")和一个值变量(" value ")： Gene Value A 12 A 10 B 3 B 5 B 6 C 1 D 3 D 4 对于我的分组变量的每一级，我希望提取最大值。因此，结果应该是一个数据帧，其中分组变量的每个级别都有一行： Gene Value A 12 B 6 C 1 D 4 aggregate能做到这一点吗？

浏览 1提问于2014-08-15得票数 72

回答已采纳

4回答

具有日期列的聚合data.frame

、、、

我在下面的数据帧中重新定义了一个 Date Expenditure Indicator 29-01-2011 5455 212 25-01-2012 5452 111 11-02-2011 365 5 我目前对支出值进行汇总感兴趣，我正在尝试使用以下函数 dta.sum <- aggregate(x = dta, FUN = sum, by = list(Group.date = dta$date)) 但R返回以下错误，即Summary.Date中的错误(c( 15614L，156

浏览 10提问于2014-07-16得票数 3

回答已采纳

1回答

如果另一列包含特定的值集，则使用R中的dplyr筛选列

、、

在以下数据框架中，我希望筛选包含person "a“、"b”和“c”的组： df <- structure(list(group = c(1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4), person = structure(c(1L, 2L, 1L, 3L, 1L, 2L, 3L, 1L, 1L, 2L, 3L, 4L), .Label = c("a", "b", "c", "e"), class = "factor")), .Names = c("gr

浏览 0提问于2017-06-11得票数 2

回答已采纳

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在R中自动分组和汇总

相关·内容

按组划分列(在数据帧中分组)

如何获取分组汇总统计数据

在求和前对R数据进行多次分组

R中的Groupwise计算

如何用dplyr::group_by给出每组数据的编号？

R中发生的次数

R:如何根据多列标准聚合(并总结) df中的行并保持先前的顺序？

查找在另外两列中具有相同值的组

在R中的聚合后选择其他行元素

根据值等级对数据帧进行过滤

计算组平均值、和或其他汇总统计数据。并将列分配给原始数据。

R:将数据帧中组的值保持在99分位数以下

如何打印要素级汇总统计数据的最小和最大值(取最小和最大中间值/比例)？

根据预先设置的条件总结数据并添加(0,1)标志

rowDiffs类型函数，将“行1”作为每个组的参考行

移除R中数据集中组的顶部和底部十进制

创建组变量

在数据帧中提取每个组内的最大值

具有日期列的聚合data.frame

如果另一列包含特定的值集，则使用R中的dplyr筛选列

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐