腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
group_by
()
和
summarize
()
来
计算
数
据点
的
出现
次数
?
、
、
、
y = c("A", "B", "D", "A", "B"), p
group_by
(x) %>% occurance2
浏览 11
提问于2021-09-28
得票数 2
回答已采纳
2
回答
获取最频繁
的
条目
、
、
如何
获取R中
出现
频率最高
的
条目?B-Chicago
group_by
(Name) %>% count(City)
浏览 15
提问于2021-11-10
得票数 2
回答已采纳
2
回答
是否按列
计算
组合?
、
我在R中寻找一种有效
的
方法
来
推导出可能
的
组合。我有一个有10列
的
数据帧,在第1列
和
第2列
的
基础上,我想
计算
报告值
的
所有组合(例如,当4:00
的
whit_spouse
和
whit_alone等于报告
的
值时)。Frequency2 04:00 At home - 0 最
浏览 13
提问于2020-03-24
得票数 0
回答已采纳
1
回答
在表中按值重新组合行,并返回折叠行
的
计数器。
、
我被这个小问题困住了: 问题是,我想总结一下NumBadDep列中
出现
的
情况,因此我将得到以下示例但我错过了第二步
的
指令
浏览 2
提问于2017-11-14
得票数 0
回答已采纳
2
回答
有条件
的
汇总计数
、
、
、
、
我想在平均值中
计算
P
的
平均值
的
同时,也要记录每个物种/年中p
的
数量,所以我
的
问题是,有没有一种方法可以用汇总(计数)
来
统计P
的
出现
量?numeric column of counts and NAs where P's should be df %>%
group_by
浏览 7
提问于2022-02-08
得票数 2
回答已采纳
2
回答
R:将字符向量传递给dplyr::all_of()
的
预期输出是什么?
、
、
、
、
我试图理解dplyr::
group_by
()
的
预期输出以及dplyr::all_of()
的
使用
。我
的
理解是,
使用
dplyr::all_of()应该将包含变量名
的
字符向量转换为单独
的
名称,以便
group_by
(),但这似乎不会发生。下面,我生成一些假数据,用(Out) all_of()将不同
的
对象传递给all_of(),并
计算
每个组中
的
观察
数
。但是,传递字符向量或<
浏览 1
提问于2021-05-14
得票数 1
回答已采纳
1
回答
R:检查其长度时tbl_spark中
的
下标越界
、
、
我是R中
的
sparklyr库
的
新手,我开始
使用
library(nycflights13),但每次尝试
计算
结果时,我
的
数据帧都会
出现
问题。我检查了tally()函数,看它是否有问题,但是当我运行fly %>%
summarize
(delay = mean(dep_delay, na.rm = TRUE))这样
的
命令
来
计算
列
的
平均值时,同样
的
错误也
出现
了但是,如
浏览 20
提问于2020-11-23
得票数 0
回答已采纳
1
回答
使用
R中
的
group_by
函数按位置调用数据帧
的
列
、
、
、
、
我想为每天
的
流数据
计算
出每年
的
月平均值。为此,我
使用
了函数
group_by
和
summarize
。这是我
的
意见: 这是我
的
密码:我认为我
的
问题是当我
使用
DailyPrec函数
计算</
浏览 2
提问于2021-05-23
得票数 1
回答已采纳
1
回答
对过滤后
的
列求和
、
我正在尝试对过滤后
的
列进行汇总,以
计算
出现
的
次数
。
如何
对字符数据类型求和。但是抛出了一个错误,告诉我can't dismissal_type type filter(dismissal_type == "bowled")%>%
summarize
_each(bowled = sum(dismissal_type
浏览 2
提问于2019-05-25
得票数 0
3
回答
作为表中
的
额外列
的
行和在R中
、
我想做一张描述性
的
表格。我首先
计算
每组
和
每一年
的
观测
数
。然后,我想再加上另一栏,列出每年观察
的
总和。library(tidyr)
group_by
(year, group) %&g
浏览 5
提问于2021-02-15
得票数 0
回答已采纳
1
回答
在dplyr中同时
使用
summarize
_all
和
summarize
、
有没有办法在dplyr链中将
summarize
_all
和
汇总语句组合在一起?如下所示:
group_by
(cyl) %>%
summarize
(n = n()) 但这当然不起作用,因为它试图总结一个摘要。预期结果是按cyl分组
的
单个data.frame,每列按平均值汇总,观察
次数<
浏览 2
提问于2018-04-13
得票数 3
3
回答
创建一个变量,按组捕获最频繁
出现
的
事件
、
、
、
、
. id v12 1 b4 2 c6 2 c 我想创建第三个变量freq,它包含id s.t在v1中最频繁
的
观察结果。
浏览 0
提问于2011-06-29
得票数 7
回答已采纳
1
回答
按ID对数据进行分组,
计算
每个ID
的
起始日期范围
和
结束日期范围内
的
记录
数
。
、
请注意,我已经用dplyr编写了一些代码
来
完成我需要
的
事情,但是它感觉非常笨拙,我想知道是否有更优雅
的
解决方案df = data.frame(3 1 2018-01-035 2 2018-01-02我想要一个表,为每个id显示第一次记录后30天内
的
记录
数
和
上次记录后30天内
的
记录
数
。: df %>
浏览 0
提问于2019-05-06
得票数 2
回答已采纳
2
回答
对dplyr摘要执行操作
、
、
dplyr
计算
汇总操作,如下所示:data%>%
summarize
(count = n_distinct(Var))ID count2 3 我想知道
如何
在不将输出保存在单独
的
对象
的
情况下对这个dplyr输出中
的
各个数
据点
执行操作例
浏览 6
提问于2021-06-16
得票数 1
回答已采纳
1
回答
使用
SparkR分组百分位
数
、
、
我想
使用
SparkR
计算
分组百分位
数
。我试过这个mtcars_spark %>% SparkR::
summarize
(p75method for function ‘approxQuantile’ for signature ‘"GroupedData", "character", "numeric", "nu
浏览 0
提问于2018-08-28
得票数 1
回答已采纳
2
回答
您能在dplyr链中
使用
两次data.frame吗?dplyr说“错误:无法处理”
、
我试图在一个data.frame链中
使用
dplyr两次。下面是一个简单
的
示例,它给出了一个错误
group_by
(Type) %>%
summarize
(X=n()) %>%
group_by
(Type) %>%
浏览 4
提问于2015-08-13
得票数 2
回答已采纳
2
回答
如何
在dplyr
summarize
_at中
使用
分位函数
、
我试图
计算
按数据集虹膜
的
种类分组
的
所有转角变量
的
25 %、50 %
和
75 %,所以
使用
dplyr::
summarize
_at函数可以只做一次。我
使用
以下代码,但总是会
出现
错误:
group_by
(Species) %>%
summarize
_at(dplyr::vars(c("Sepal.Length","Sepal.Width0
浏览 3
提问于2020-03-28
得票数 1
回答已采纳
1
回答
使用
(逻辑?)
计算
频率表达式
、
我已经找到了多种方法
来
计算
观测值,然而,我正在试图弄清楚
如何
使用
(logical?)表达式。我有一组大约一百万个观察值
的
海量数据。10.16667 CPUELE25399 1979 1 8 0有154个唯一ID
和
类似的我将重点放在每个唯一ID
的
所有值
的
前1%,对于每个唯一ID,我已经
使用
它们
的</em
浏览 0
提问于2015-07-17
得票数 0
3
回答
dplyr按工作日汇总日期
、
在不同
的
日期,我从不同的人那里得到了多个观察。dates = seq.Date(as.Date("2015-01-01"), by="month", length=20))这应该
使用
dplyr
和
summarize
来
完成,因为我
的
真实数据集有更多
的
列,我用不同
的
统计信息进
浏览 2
提问于2016-05-20
得票数 0
回答已采纳
2
回答
对不包含变量
的
所有行
使用
group_by
并对dplyr进行汇总,以将变量转换为
group_by
、
= c("A", "A", "B", "B", "B"), 我知道我可以用 summarise(no.c = n(),
计算
观测
次数
,并以id表示平均值。如果我想
计算
所
浏览 0
提问于2016-11-19
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用dplyer包进行数据转换
快速掌握R语言中类SQL数据库操作技巧
Excel多表查询,这种方法比较快
数据挖掘领域十大经典算法之—K-邻近算法/kNN
sklearn 中的两个半监督标签传播算法 LabelPropagation和LabelSpreading
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券