R:如何使用group_by()计算一个变量在另一个变量中的比例？

使用group_by()函数可以对数据进行分组，然后使用summarize()函数计算每个组中的变量总和。为了计算一个变量在另一个变量中的比例，可以按照需要的分组变量进行分组，然后使用mutate()函数创建一个新的变量，该变量的值为需要计算比例的变量除以另一个变量的总和。下面是一个示例代码：

library(dplyr)

# 创建一个示例数据集
data <- data.frame(category = c("A", "A", "B", "B", "C", "C"),
                   value = c(10, 20, 30, 40, 50, 60))

# 使用group_by()和summarize()计算每个类别的总和
sum_data <- data %>%
  group_by(category) %>%
  summarize(total = sum(value))

# 使用mutate()计算每个类别的比例
result <- data %>%
  left_join(sum_data, by = "category") %>%
  mutate(percentage = value / total)

# 打印结果
print(result)

在上面的代码中，首先使用group_by()函数按照"category"变量进行分组，然后使用summarize()函数计算每个组中"value"变量的总和，得到一个包含每个类别总和的数据框sum_data。接下来，使用left_join()函数将原始数据集和总和数据集连接起来，然后使用mutate()函数创建一个新的变量"percentage"，该变量的值为"value"除以"total"，即计算了"value"在"total"中的比例。最后，打印结果。

这种方法可以用于计算任意两个变量之间的比例，只需将代码中的"category"替换为需要分组的变量，"value"替换为需要计算比例的变量即可。

推荐的腾讯云相关产品：腾讯云云服务器（https://cloud.tencent.com/product/cvm）

R:如何使用group_by()计算一个变量在另一个变量中的比例？

、、、、

我想使用group_by在variable：sex中显示每个教育程度(变量：edattain)的比例。到目前为止，我已经计算了以下edattain的比例： india04_new4 %>%group_by(edattain) %>% summarise(share = sum(perwt, na.rm

浏览 25提问于2020-10-08得票数 0

回答已采纳

1回答

迭代过滤R中的数据表

、、

我有一个包含3个变量，1个频率列的数据表，我希望添加另一个比例列。这些频率捕获了这种情况发生的次数。但是如果我将prop.table加到它上面，它会计算整个data.table的比例，而我真的想让它计算变量2的子集中的比例。我想过迭

浏览 5提问于2021-05-12得票数 0

1回答

在R中使用Tidyverse中的sum()函数时出现简单的比例错误

、

我真的不确定我写的函数会出什么问题。它使用R中的gss_cat数据帧。我想做的只是计算一个简单的比例，但是由于某种原因，sum()函数读取每个单独的单元格，并将其用作输出。is.na(age)) %>% group_by(age, marital) %>% count() %>% mutate(prop = n/sum(n)) 我期望发生的</e

浏览 17提问于2020-04-24得票数 1

回答已采纳

1回答

R- dplyr函数计数

、

我其实有两个相关的问题。library(dplyr) data %>%第二个问题涉及在函数中包含第二个grouping。有时，在<e

浏览 0提问于2016-09-21得票数 1

1回答

R中几个群的相对重要性

、、、

当我想运行几个组时，如何使用R中的松弛软件包计算其相对重要性？例如，在mtcar dataframe中，我想计算每个cyl在mpg上的几个变量的相对重要性。我在mpg上计算了变量的相对重要性，但我不知道如何使每组变量。我试图插入group_by</e

浏览 3提问于2022-09-06得票数 0

回答已采纳

1回答

根据多列因子水平计算多个变量的占比

、、

我有几个人口统计变量和问题变量的调查数据，这些变量已经编码为二进制数据。0 1我想要实现的是一个可以写入csv的表格，其中包含人口统计变量中每个因素水平的1的比例，以及所有问题变量的<em

浏览 5提问于2021-06-09得票数 2

回答已采纳

1回答

R中2层地层的随机选择

、、、

我有一个很大的数据集，我想要修改它，使其在比例上看起来与另一个数据集“相似”。因此目标数据集具有变量X的比例，如下所示 'A' = 0.5,'C'= 0.1 3 ctrl

浏览 10提问于2020-06-11得票数 0

3回答

使用dplyr创建包含多个分类/因素变量的汇总比例表

、

我试图用另一个变量创建一个表来总结几个分类变量(使用频率和比例)。我想用dplyr包来做这件事。 mtcars %>% summarise (

浏览 4提问于2016-01-04得票数 17

回答已采纳

1回答

`dplyr::group_by`中的因素有限制吗？

、、

我正在为如何使用变量的lag来计算组件的磨损而苦苦挣扎。但是，我需要计算不同组的磨损，所以我使用group_by函数，但这里有一个问题，当我使用需要分组的变量时，结果是一列“NA”，但当我通过将一个因子较少的另一个变量分组进行测试时，计算可以正常工作。我<e

浏览 29提问于2021-11-17得票数 3

回答已采纳

2回答

查找group_by条件为true的行比例的最佳方法

、、

假设我在R中有一个dataframe -这个例子是为了说明的目的而编造的。变量1 weather可以取值为Rain或Shine。变量2 sport可以取值为Basketball或Football。我想找出变量之间的关系，所以我决定总结一下雨天我打篮球和踢足球的比例。我目前正在做一些类似这样的事情。data %>% group_by(weather, s

浏览 37提问于2021-08-05得票数 0

1回答

用连续变量绘制组比例

、、

我想把一个群体的水平比例和一个连续变量一起画出来。由于x轴是连续的，所以不可能在每个点上计算比例(因为它们的数目是无限的)。因此，通常情况下，一个人将连续变量切成纸箱，并绘制它们。另一个解决方案是使用密度，但是我想要y轴中的比例(所以，百分比)，我很确定密度不是关于比例<em

浏览 10提问于2022-03-02得票数 1

回答已采纳

1回答

在调查中迭代一组变量-R

、、、

正如指示的srvyr::survey_mean，，如果您想要计算惊人的srvyr包中的分类变量的比例，首先必须将变量的组作为因子，然后使用空的，如本例所示。我的目标是迭代第二个变量、cname、和sch.wide，同时保留第一个分组变量stype，以避免重复代码。pw,stype, cname,sch.wide

浏览 2提问于2019-11-28得票数 1

回答已采纳

1回答

是否有一种方法可以得到一个在R中也显示比例的COUNTIF类摘要？

、、、

我试图在R中总结我的变量，我的数据如下所示：1 adverb 0 13 filler 105 filler 0 07 adverb 1 1 我需要的是一个表，它按照每个变量(现在/不存在)的</em

浏览 1提问于2022-01-25得票数 2

回答已采纳

1回答

如何实现以下cabbage_exp数据集的plyr包代码的dplyr。任何帮助都会成为学徒

、、

plyr) 在库中，有一个名为cabbage_exp的数据集。在这个数据集中，我想计算每个组中权重的比例(按日期分组)。在我的数据集中，有6个样本，每个样本都包含日期和权重。有3个日期d16、d20和d21，每个日期行都有一个权重值。下面的代码plyr包分裂在“日期”和计算权重的比例

浏览 1提问于2017-08-29得票数 0

回答已采纳

1回答

R中比例图的生成

我想在R中创建一个成比例的条形图，我有两个变量，一个是“醉酒”，一个是“住房”，我想要绘制每个类别的“住宅”中满足“醉酒”的个体的比例。dataframe如下所示：我想知道如何图表的比例，每一类住房(1至4)，以满足"1“的

浏览 1提问于2019-05-31得票数 0

2回答

在函数中使用``expr()‘

、

解释说，expr()在函数中没有用处。让我们假设我想在一个函数中分组一个tibble。data(iris)显而易见的方法是使用“卷曲卷曲”。func_a <- function(data, grouping) {} func_a(iris, S

浏览 3提问于2020-07-05得票数 2

回答已采纳

1回答

如何根据列的范围(即<15、15-30等)创建因子变量

我正在根据RStudio中的'nycflights13‘数据为学校做作业，我需要创建一个因子变量(称为delaylevel)，它基于我已经创建的另一个名为flight1的过滤器变量(如下所示)，将dep_delay分为4类(<15分钟、15 - 30分钟、30 - 60分钟、<60分钟)，并将这个新变量称为flight2。在我这样做之后，我需要找出基于flt2的延迟15分钟或更

浏览 17提问于2019-03-30得票数 0

回答已采纳

1回答

如何使用fct_reorder()只对另一个向量的子集重新排序？

、

考虑来自gss_cat包的forcats数据集。注意，我按照marital变量中"Other“的比例排序race。我解决了这个问题，它创建了上面的图，如下所示： group_by(marital) %>% mutate(new_varmax)) %>%

浏览 0提问于2021-06-26得票数 1

回答已采纳

2回答

在R中对数据进行分组后，计算多列中的NAs数

、、、、

我有一个数据框架df，它是一个日期Date、一个区域Region和一个标识符ID，然后是一系列的12个变量(例如。-01-02 R1 2 3 3本质上，我希望创建另一个数据框架来计算每个变量的NAs数，按ID和Region分组(可以忽略日期)我设法为一个变量获得了它，但是<

浏览 0提问于2022-08-06得票数 -2

回答已采纳

2回答

用变量的级别绘制多个图。

、、、、

= F) 它成功了，但如果你仔细看，比例是错的。它没有计算每一组的比例，而是一个很大的比例。我希望第一组的比例是0.6，而不是0.3。然后我尝试了dplyr包，它甚至没有创建两个图。它忽略了group_by命令。不过这次的比

浏览 0提问于2018-04-26得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

R:如何使用group_by()计算一个变量在另一个变量中的比例？

相关·内容

R:如何使用group_by()计算一个变量在另一个变量中的比例？

迭代过滤R中的数据表

在R中使用Tidyverse中的sum()函数时出现简单的比例错误

R- dplyr函数计数

R中几个群的相对重要性

根据多列因子水平计算多个变量的占比

R中2层地层的随机选择

使用dplyr创建包含多个分类/因素变量的汇总比例表

`dplyr::group_by`中的因素有限制吗？

查找group_by条件为true的行比例的最佳方法

用连续变量绘制组比例

在调查中迭代一组变量-R

是否有一种方法可以得到一个在R中也显示比例的COUNTIF类摘要？

如何实现以下cabbage_exp数据集的plyr包代码的dplyr。任何帮助都会成为学徒

R中比例图的生成

在函数中使用``expr()‘

如何根据列的范围(即<15、15-30等)创建因子变量

如何使用fct_reorder()只对另一个向量的子集重新排序？

在R中对数据进行分组后，计算多列中的NAs数

用变量的级别绘制多个图。

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐