R- group by and summarise类别变量(前2个，计数)

r、dplyr、aggregate、categorical-data、summarize

我需要按字段A对data.frame进行分组，并总结分类变量B，保留其前两个值和各自的计数。B有重复的值。double to have duplicate values group_by(gear) %>% n = n(), disp_top1_n

浏览 23提问于2020-12-15得票数 0

1回答

在几个列上应用dplyr函数

r、dplyr

我有一个数据框架，包括150 K行和77个分类变量，如下所示。我如何找到每个类别的得分和计数？一个数值变量和77个分组变量 students<-data.frame(ID = c("A","B","C","D"), Gender = c("M","F","F","F"), SocioeconomicScores = c(45,98, 50,3

浏览 0提问于2019-05-06得票数 2

回答已采纳

1回答

如何将summarize_if与dplyr相结合

r、dplyr

我想将一个summarize语句(以计数观察的数量)与一个summarise_if语句(总结所有数值变量)结合起来。使用data("iris")，我想： group_by(Species)%>% summari

浏览 0提问于2022-11-23得票数 0

回答已采纳

1回答

迭代过滤R中的数据表

r、loops、filter

我有一个包含3个变量，1个频率列的数据表，我希望添加另一个比例列。这些频率捕获了这种情况发生的次数。但是如果我将prop.table加到它上面，它会计算整个data.table的比例，而我真的想让它计算变量2的子集中的比例。我想过迭代，但在表中似乎很复杂。

浏览 5提问于2021-05-12得票数 0

1回答

如何在使用Dplyr::Group_by和Dplyr::Summarise时输出来自不同分组变量的摘要列表

r、tidyverse、purrr、rlang

library(tidyverse)mtcars%>%group_by(cyl)%>%summarise(Count=n())mtcars%>%group_by(cyl,am)%>%summarise(Count=n())dat

浏览 0提问于2018-02-02得票数 1

回答已采纳

1回答

在R中按用户ID分组后，我能总结变量组合吗？

我试过典型的SISessions1 %>% group_by(StudentID)...

浏览 4提问于2022-04-17得票数 1

回答已采纳

1回答

根据ggplot2中类别的比例调整(堆叠)条宽

r、ggplot2、width、bar-chart

我试图根据类别的计数(或比例)更改我的(堆叠)条的宽度，例如我使用了钻石数据集。我希望看到一个变化的宽度，根据每个类别的频率(变量cut)。我首先创建了一个变量cut_prop，然后用下面的代码绘制 group_by(cut) %>% coord_flip() R给出了一

浏览 1提问于2018-04-23得票数 4

回答已采纳

2回答

如何在R中用重复名称对行进行分组？

r、dataframe、group-by、data-visualization、subset

cSplit(board_game,splitCols=c("mechanic","category"), sep = ",", direction = "long") group_byAdventure", &q

浏览 0提问于2020-10-26得票数 0

回答已采纳

2回答

将数据集拆分为嵌套的数据列表，然后使用Tidyr和Purrr进行传播。

r、tidyverse、purrr

library(ggmosaic)下面是示例代码select(sex,marital,degree,health)%>%summarise(Count=n()) 下面的代码将数据集拆分为嵌套列表，其中包含程度变量的每个类别的男性和女性表(性别变量)。我想重塑，或使用Tidyr，传播“婚姻”变量，或者这应该再分开

浏览 6提问于2017-08-14得票数 0

回答已采纳

1回答

R dplyr按两个以上的变量分组，并计算每个第一个变量组内的相对百分比

r、group-by、dplyr

我想用4个变量对数据帧进行分组，用计数汇总它，然后计算每行占总计数的百分比，比较第一个变量每组中的总计数。作为最后一步，我计算了一个累积百分比，并根据某些阈值将行分配到一个类别。library(dplyr) left_join(airlines, by = c('carrier'), na_matches = "never") %>% group_by(origi

浏览 28提问于2020-07-23得票数 0

回答已采纳

6回答

Tidyverse:在分组数据中过滤n个最大的组

r、dplyr、top-n

我想根据计数过滤n个最大的组，然后对过滤后的数据进行一些计算。我想通过计数筛选出两个最大的品牌，然后在每个品牌/类别组合中找到平均点击量。14.0||B | 2| 11.5|df %>% top_n(2, Brand) %>% # Largest 2 brands by count

浏览 0提问于2018-09-27得票数 12

回答已采纳

1回答

何时在dplyr中使用"Do“函数

r、dplyr

例如，如果我想从变量Index的"A“、"C”和"I“类别中提取前2行，可以使用以下语法。t <- mydata %>% filter(Index %in% c("A", "C", "I")) %>% group_by(Index) %>% do(head(.,2)) 据我所知，在按索引分组后例如，要计算按变量Y2014分组的变量Index的平均值，我认为应该使用以下代码。t

浏览 3提问于2018-01-10得票数 20

回答已采纳

1回答

我有一个不同类型的变量的数据(数字，字符，因子)在列上，我希望可以立即总结。我有一个ID列要根据其他列的级别来计数。每个列都有不同的级别，如果它们是字符或因素，我想知道每个级别的ID的频率。此外，如果列是数字的，我希望返回汇总统计数据，如平均值、sd和分位数。理想情况下，我应该使用dplyr和group_by()和summarise()函数来实现这一点，但是它要求我一次对每一列进行分组，然后指定是用n()计数还是由于是数字而需要摘要统计。(Car) %>% summari

浏览 3提问于2020-11-25得票数 3

回答已采纳

1回答

使用Tidyverse方法将数据集拆分为多个表

r、tidyverse、purrr

happy2<-happy%>%group_by(sex,marital,degree,health)%>%现在，使用happy2数据集，我想将数据除以“度”，在每个学位类别中，将有两个表，一个用于男性，一个用于女性，基于“性别”变量。每个表将以“婚内”和“计数”作为列，以“健康”作为行。我希望找到一种优雅的方法来使用Tidyverse方法来创建这些表，例如ti

浏览 3提问于2017-08-13得票数 0

回答已采纳

3回答

dplyr()分组和获取计数-错误消息评估错误:不适用于类“逻辑”对象的“summarise_”方法

r、dplyr

我有一个数据框架(df)，有两个变量，位置和天气。我想要一个宽的数据框架，其中数据是按位置分组的，其中有三个新变量(weather_1到weather_3)，其中有原始天气变量中的观测计数。问题是，当我尝试使用dplyr()::mutate()时，我只得到真/假输出，而不是计数，或者是一个错误消息：Evaluation error: no applicable method for 'summariseaz","bi","ca

浏览 0提问于2017-11-14得票数 1

回答已采纳

1回答

为什么R中的group_by()函数不能正常工作？

r、dataframe、dplyr

我有一个大型的dataframe，我试图在一个列中按8个类别进行排序，然后使用group_by()查找它们的权重之和(kg)，并总结来自dplyr包的函数。然而，在创建的“总”变量中，某些类别的和产生N/A，我不知道为什么，因为它们应该是数值。我能看到的数据没有什么奇怪的地方。代码： totals <- db %>% group_by(category) %>% summarise(kilos = sum(weight))

浏览 3提问于2022-08-09得票数 0

1回答

根据唯一ID列汇总数据

r、dplyr、tidyverse、unique、tapply

我已经设法使用tapply一次为一个变量获取所需的内容，但不能同时为多个变量执行此操作。此外，我想要应用它的数据帧有+50,000行，我想将它应用到+10个不同的计数变量。countdf %>% summarise(va

浏览 20提问于2021-01-25得票数 0

2回答

如何使用R中的两个表创建交叉表？

r、pivot-table

25078 27 82099 29 82580-90 770 340 250我已经为每个类别创建了两个表，以使用dplyr包获得平均值和计数，如下所示： table1 <- group_b

浏览 1提问于2018-01-28得票数 3

1回答

是否有与Stata的egen函数等价的？

r、stata

Stata有一个非常好的命令egen，它可以轻松地计算一组观察的统计数据。例如，可以计算每个组的最大值、平均值和最小值，并将它们作为变量添加到详细的数据集中。Stata命令是一行代码：我从未在R.summarise包中找到相同的命令，这使得计算每个组的统计信息变得很容易，但是接下来我必须运行一个循环来将统计数据与每个观察相关联：N <- 1000 tf <- data.fra

浏览 2提问于2014-06-11得票数 8

回答已采纳

1回答

SQL Server:在每个类别中选择前N个记录:Count-Rank-在一个脚本中选择

sql、sql-server

Existing questions已经有了每个类别的底层计数，然后考虑如何在每个类别中选择前10名，但是否可以在一个脚本中端到端地执行这一操作，即按类别计数，按类别排名，然后选择每个类别前10名？我已经完成了前两个步骤，现在想知道如何合并第三个步骤，即在同一个脚本中选择前N个结果： ;with cte as select day(t

浏览 21提问于2019-06-19得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在几个列上应用dplyr函数

如何将summarize_if与dplyr相结合

迭代过滤R中的数据表

如何在使用Dplyr::Group_by和Dplyr::Summarise时输出来自不同分组变量的摘要列表

在R中按用户ID分组后，我能总结变量组合吗？

根据ggplot2中类别的比例调整(堆叠)条宽

如何在R中用重复名称对行进行分组？

将数据集拆分为嵌套的数据列表，然后使用Tidyr和Purrr进行传播。

R dplyr按两个以上的变量分组，并计算每个第一个变量组内的相对百分比

Tidyverse:在分组数据中过滤n个最大的组

何时在dplyr中使用"Do“函数

在R中一次生成多个频率表

使用Tidyverse方法将数据集拆分为多个表

dplyr()分组和获取计数-错误消息评估错误:不适用于类“逻辑”对象的“summarise_”方法

为什么R中的group_by()函数不能正常工作？

根据唯一ID列汇总数据

如何使用R中的两个表创建交叉表？

是否有与Stata的egen函数等价的？

SQL Server:在每个类别中选择前N个记录:Count-Rank-在一个脚本中选择

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐