如何使用group_by()和summarize()来计算数据点的出现次数？

、、、

y = c("A", "B", "D", "A", "B"), p group_by(x) %>% occurance2

浏览 11提问于2021-09-28得票数 2

回答已采纳

2回答

获取最频繁的条目

、、

如何获取R中出现频率最高的条目？B-Chicago group_by(Name) %>% count(City)

浏览 15提问于2021-11-10得票数 2

回答已采纳

2回答

是否按列计算组合？

、

我在R中寻找一种有效的方法来推导出可能的组合。我有一个有10列的数据帧，在第1列和第2列的基础上，我想计算报告值的所有组合(例如，当4:00的whit_spouse和whit_alone等于报告的值时)。Frequency2 04:00 At home - 0 最

浏览 13提问于2020-03-24得票数 0

回答已采纳

1回答

在表中按值重新组合行，并返回折叠行的计数器。

、

我被这个小问题困住了：问题是，我想总结一下NumBadDep列中出现的情况，因此我将得到以下示例但我错过了第二步的指令

浏览 2提问于2017-11-14得票数 0

回答已采纳

2回答

有条件的汇总计数

、、、、

我想在平均值中计算P的平均值的同时，也要记录每个物种/年中p的数量，所以我的问题是，有没有一种方法可以用汇总(计数)来统计P的出现量？numeric column of counts and NAs where P's should be df %>% group_by

浏览 7提问于2022-02-08得票数 2

回答已采纳

2回答

R:将字符向量传递给dplyr::all_of()的预期输出是什么？

、、、、

我试图理解dplyr::group_by()的预期输出以及dplyr::all_of()的使用。我的理解是，使用dplyr::all_of()应该将包含变量名的字符向量转换为单独的名称，以便group_by()，但这似乎不会发生。下面，我生成一些假数据，用(Out) all_of()将不同的对象传递给all_of()，并计算每个组中的观察数。但是，传递字符向量或<

浏览 1提问于2021-05-14得票数 1

回答已采纳

1回答

R:检查其长度时tbl_spark中的下标越界

、、

我是R中的sparklyr库的新手，我开始使用library(nycflights13)，但每次尝试计算结果时，我的数据帧都会出现问题。我检查了tally()函数，看它是否有问题，但是当我运行fly %>% summarize(delay = mean(dep_delay, na.rm = TRUE))这样的命令来计算列的平均值时，同样的错误也出现了但是，如

浏览 20提问于2020-11-23得票数 0

回答已采纳

1回答

使用R中的group_by函数按位置调用数据帧的列

、、、、

我想为每天的流数据计算出每年的月平均值。为此，我使用了函数group_by和summarize。这是我的意见：这是我的密码：我认为我的问题是当我使用DailyPrec函数计算</

浏览 2提问于2021-05-23得票数 1

回答已采纳

1回答

对过滤后的列求和

、

我正在尝试对过滤后的列进行汇总，以计算出现的次数。如何对字符数据类型求和。但是抛出了一个错误，告诉我can't dismissal_type type filter(dismissal_type == "bowled")%>% summarize_each(bowled = sum(dismissal_type

浏览 2提问于2019-05-25得票数 0

3回答

作为表中的额外列的行和在R中

、

我想做一张描述性的表格。我首先计算每组和每一年的观测数。然后，我想再加上另一栏，列出每年观察的总和。library(tidyr) group_by(year, group) %&g

浏览 5提问于2021-02-15得票数 0

回答已采纳

1回答

在dplyr中同时使用summarize_all和summarize

、

有没有办法在dplyr链中将summarize_all和汇总语句组合在一起？如下所示： group_by(cyl) %>% summarize(n = n()) 但这当然不起作用，因为它试图总结一个摘要。预期结果是按cyl分组的单个data.frame，每列按平均值汇总，观察次数<

浏览 2提问于2018-04-13得票数 3

3回答

创建一个变量，按组捕获最频繁出现的事件

、、、、

. id v12 1 b4 2 c6 2 c 我想创建第三个变量freq，它包含id s.t在v1中最频繁的观察结果。

浏览 0提问于2011-06-29得票数 7

回答已采纳

1回答

按ID对数据进行分组，计算每个ID的起始日期范围和结束日期范围内的记录数。

、

请注意，我已经用dplyr编写了一些代码来完成我需要的事情，但是它感觉非常笨拙，我想知道是否有更优雅的解决方案df = data.frame(3 1 2018-01-035 2 2018-01-02我想要一个表，为每个id显示第一次记录后30天内的记录数和上次记录后30天内的记录数。： df %>

浏览 0提问于2019-05-06得票数 2

回答已采纳

2回答

对dplyr摘要执行操作

、、

dplyr计算汇总操作，如下所示：data%>% summarize(count = n_distinct(Var))ID count2 3 我想知道如何在不将输出保存在单独的对象的情况下对这个dplyr输出中的各个数据点执行操作例

浏览 6提问于2021-06-16得票数 1

回答已采纳

1回答

使用SparkR分组百分位数

、、

我想使用SparkR计算分组百分位数。我试过这个mtcars_spark %>% SparkR::summarize(p75method for function ‘approxQuantile’ for signature ‘"GroupedData", "character", "numeric", "nu

浏览 0提问于2018-08-28得票数 1

回答已采纳

2回答

您能在dplyr链中使用两次data.frame吗？dplyr说“错误:无法处理”

、

我试图在一个data.frame链中使用dplyr两次。下面是一个简单的示例，它给出了一个错误 group_by(Type) %>%summarize(X=n()) %>% group_by(Type) %>%

浏览 4提问于2015-08-13得票数 2

回答已采纳

2回答

如何在dplyr summarize_at中使用分位函数

、

我试图计算按数据集虹膜的种类分组的所有转角变量的25 %、50 %和75 %，所以使用dplyr::summarize_at函数可以只做一次。我使用以下代码，但总是会出现错误： group_by(Species) %>% summarize_at(dplyr::vars(c("Sepal.Length","Sepal.Width0

浏览 3提问于2020-03-28得票数 1

回答已采纳

1回答

使用(逻辑？)计算频率表达式

、

我已经找到了多种方法来计算观测值，然而，我正在试图弄清楚如何使用(logical?)表达式。我有一组大约一百万个观察值的海量数据。10.16667 CPUELE25399 1979 1 8 0有154个唯一ID和类似的我将重点放在每个唯一ID的所有值的前1%，对于每个唯一ID，我已经使用它们的</em

浏览 0提问于2015-07-17得票数 0

3回答

dplyr按工作日汇总日期

、

在不同的日期，我从不同的人那里得到了多个观察。dates = seq.Date(as.Date("2015-01-01"), by="month", length=20))这应该使用dplyr和summarize来完成，因为我的真实数据集有更多的列，我用不同的统计信息进

浏览 2提问于2016-05-20得票数 0

回答已采纳

2回答

对不包含变量的所有行使用group_by并对dplyr进行汇总，以将变量转换为group_by

、

= c("A", "A", "B", "B", "B"), 我知道我可以用 summarise(no.c = n(), 计算观测次数，并以id表示平均值。如果我想计算所

浏览 0提问于2016-11-19得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

获取最频繁的条目

是否按列计算组合？

在表中按值重新组合行，并返回折叠行的计数器。

有条件的汇总计数

R:将字符向量传递给dplyr::all_of()的预期输出是什么？

R:检查其长度时tbl_spark中的下标越界

使用R中的group_by函数按位置调用数据帧的列

对过滤后的列求和

作为表中的额外列的行和在R中

在dplyr中同时使用summarize_all和summarize

创建一个变量，按组捕获最频繁出现的事件

按ID对数据进行分组，计算每个ID的起始日期范围和结束日期范围内的记录数。

对dplyr摘要执行操作

使用SparkR分组百分位数

您能在dplyr链中使用两次data.frame吗？dplyr说“错误:无法处理”

如何在dplyr summarize_at中使用分位函数

使用(逻辑？)计算频率表达式

dplyr按工作日汇总日期

对不包含变量的所有行使用group_by并对dplyr进行汇总，以将变量转换为group_by

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐