腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1118)
视频
沙龙
2
回答
R-
group
by and
summarise
类别
变量
(
前
2个,
计数
)
r
、
dplyr
、
aggregate
、
categorical-data
、
summarize
我需要按字段A对data.frame进行分组,并总结分类
变量
B,保留其
前
两个值和各自的
计数
。B有重复的值。double to have duplicate values
group
_by(gear) %>% n = n(), disp_top1_n
浏览 23
提问于2020-12-15
得票数 0
1
回答
在几个列上应用dplyr函数
r
、
dplyr
我有一个数据框架,包括150 K行和77个分类
变量
,如下所示。我如何找到每个
类别
的得分和
计数
?一个数值
变量
和77个分组
变量
students<-data.frame(ID = c("A","B","C","D"), Gender = c("M","F","F","F"), SocioeconomicScores = c(45,98, 50,3
浏览 0
提问于2019-05-06
得票数 2
回答已采纳
1
回答
如何将summarize_if与dplyr相结合
r
、
dplyr
我想将一个summarize语句(以
计数
观察的数量)与一个
summarise
_if语句(总结所有数值
变量
)结合起来。使用data("iris"),我想:
group
_by(Species)%>%
summari
浏览 0
提问于2022-11-23
得票数 0
回答已采纳
1
回答
迭代过滤R中的数据表
r
、
loops
、
filter
我有一个包含3个
变量
,1个频率列的数据表,我希望添加另一个比例列。 这些频率捕获了这种情况发生的次数。但是如果我将prop.table加到它上面,它会计算整个data.table的比例,而我真的想让它计算
变量
2的子集中的比例。 我想过迭代,但在表中似乎很复杂。
浏览 5
提问于2021-05-12
得票数 0
1
回答
如何在使用Dplyr::
Group
_by和Dplyr::
Summarise
时输出来自不同分组
变量
的摘要列表
r
、
tidyverse
、
purrr
、
rlang
library(tidyverse)mtcars%>%
group
_by(cyl)%>%
summarise
(Count=n())mtcars%>%
group
_by(cyl,am)%>%
summarise
(Count=n())dat
浏览 0
提问于2018-02-02
得票数 1
回答已采纳
1
回答
在R中按用户ID分组后,我能总结
变量
组合吗?
r
我试过典型的SISessions1 %>%
group
_by(StudentID)...
浏览 4
提问于2022-04-17
得票数 1
回答已采纳
1
回答
根据ggplot2中
类别
的比例调整(堆叠)条宽
r
、
ggplot2
、
width
、
bar-chart
我试图根据
类别
的
计数
(或比例)更改我的(堆叠)条的宽度,例如我使用了钻石数据集。我希望看到一个变化的宽度,根据每个
类别
的频率(
变量
cut)。我首先创建了一个
变量
cut_prop,然后用下面的代码绘制
group
_by(cut) %>% coord_flip() R给出了一
浏览 1
提问于2018-04-23
得票数 4
回答已采纳
2
回答
如何在R中用重复名称对行进行分组?
r
、
dataframe
、
group-by
、
data-visualization
、
subset
cSplit(board_game,splitCols=c("mechanic","category"), sep = ",", direction = "long")
group
_byAdventure", &q
浏览 0
提问于2020-10-26
得票数 0
回答已采纳
2
回答
将数据集拆分为嵌套的数据列表,然后使用Tidyr和Purrr进行传播。
r
、
tidyverse
、
purrr
library(ggmosaic)下面是示例代码select(sex,marital,degree,health)%>%
summarise
(Count=n()) 下面的代码将数据集拆分为嵌套列表,其中包含程度
变量
的每个
类别
的男性和女性表(性别
变量
)。我想重塑,或使用Tidyr,传播“婚姻”
变量
,或者这应该再分开
浏览 6
提问于2017-08-14
得票数 0
回答已采纳
1
回答
R dplyr按两个以上的
变量
分组,并计算每个第一个
变量
组内的相对百分比
r
、
group-by
、
dplyr
我想用4个
变量
对数据帧进行分组,用
计数
汇总它,然后计算每行占总
计数
的百分比,比较第一个
变量
每组中的总
计数
。作为最后一步,我计算了一个累积百分比,并根据某些阈值将行分配到一个
类别
。library(dplyr) left_join(airlines, by = c('carrier'), na_matches = "never") %>%
group
_by(origi
浏览 28
提问于2020-07-23
得票数 0
回答已采纳
6
回答
Tidyverse:在分组数据中过滤n个最大的组
r
、
dplyr
、
top-n
我想根据
计数
过滤n个最大的组,然后对过滤后的数据进行一些计算。我想通过
计数
筛选出两个最大的品牌,然后在每个品牌/
类别
组合中找到平均点击量。14.0||B | 2| 11.5|df %>% top_n(2, Brand) %>% # Largest 2 brands by count
浏览 0
提问于2018-09-27
得票数 12
回答已采纳
1
回答
何时在dplyr中使用"Do“函数
r
、
dplyr
例如,如果我想从
变量
Index的"A“、"C”和"I“
类别
中提取
前
2行,可以使用以下语法。t <- mydata %>% filter(Index %in% c("A", "C", "I")) %>%
group
_by(Index) %>% do(head(.,2)) 据我所知,在按索引分组后例如,要计算按
变量
Y2014分组的
变量
Index的平均值,我认为应该使用以下代码。t
浏览 3
提问于2018-01-10
得票数 20
回答已采纳
1
回答
在R中一次生成多个频率表
r
、
dplyr
、
summary
我有一个不同类型的
变量
的数据(数字,字符,因子)在列上,我希望可以立即总结。我有一个ID列要根据其他列的级别来
计数
。 每个列都有不同的级别,如果它们是字符或因素,我想知道每个级别的ID的频率。此外,如果列是数字的,我希望返回汇总统
计数
据,如平均值、sd和分位数。理想情况下,我应该使用dplyr和
group
_by()和
summarise
()函数来实现这一点,但是它要求我一次对每一列进行分组,然后指定是用n()
计数
还是由于是数字而需要摘要统计。(Car) %>%
summari
浏览 3
提问于2020-11-25
得票数 3
回答已采纳
1
回答
使用Tidyverse方法将数据集拆分为多个表
r
、
tidyverse
、
purrr
happy2<-happy%>%
group
_by(sex,marital,degree,health)%>%现在,使用happy2数据集,我想将数据除以“度”,在每个学位
类别
中,将有两个表,一个用于男性,一个用于女性,基于“性别”
变量
。每个表将以“婚内”和“
计数
”作为列,以“健康”作为行。 我希望找到一种优雅的方法来使用Tidyverse方法来创建这些表,例如ti
浏览 3
提问于2017-08-13
得票数 0
回答已采纳
3
回答
dplyr()分组和获取
计数
-错误消息评估错误:不适用于类“逻辑”对象的“
summarise
_”方法
r
、
dplyr
我有一个数据框架(df),有两个
变量
,位置和天气。 我想要一个宽的数据框架,其中数据是按位置分组的,其中有三个新
变量
(weather_1到weather_3),其中有原始天气
变量
中的观测
计数
。问题是,当我尝试使用dplyr()::mutate()时,我只得到真/假输出,而不是
计数
,或者是一个错误消息:Evaluation error: no applicable method for '
summarise
az","bi","ca
浏览 0
提问于2017-11-14
得票数 1
回答已采纳
1
回答
为什么R中的
group
_by()函数不能正常工作?
r
、
dataframe
、
dplyr
我有一个大型的dataframe,我试图在一个列中按8个
类别
进行排序,然后使用
group
_by()查找它们的权重之和(kg),并总结来自dplyr包的函数。然而,在创建的“总”
变量
中,某些
类别
的和产生N/A,我不知道为什么,因为它们应该是数值。我能看到的数据没有什么奇怪的地方。代码: totals <- db %>%
group
_by(category) %>%
summarise
(kilos = sum(weight))
浏览 3
提问于2022-08-09
得票数 0
1
回答
根据唯一ID列汇总数据
r
、
dplyr
、
tidyverse
、
unique
、
tapply
我已经设法使用tapply一次为一个
变量
获取所需的内容,但不能同时为多个
变量
执行此操作。 此外,我想要应用它的数据帧有+50,000行,我想将它应用到+10个不同的
计数
变量
。countdf %>%
summarise
(va
浏览 20
提问于2021-01-25
得票数 0
2
回答
如何使用R中的两个表创建交叉表?
r
、
pivot-table
25078 27 82099 29 82580-90 770 340 250我已经为每个
类别
创建了两个表,以使用dplyr包获得平均值和
计数
,如下所示: table1 <-
group
_b
浏览 1
提问于2018-01-28
得票数 3
1
回答
是否有与Stata的egen函数等价的?
r
、
stata
Stata有一个非常好的命令egen,它可以轻松地计算一组观察的统
计数
据。例如,可以计算每个组的最大值、平均值和最小值,并将它们作为
变量
添加到详细的数据集中。Stata命令是一行代码:我从未在R.
summarise
包中找到相同的命令,这使得计算每个组的统计信息变得很容易,但是接下来我必须运行一个循环来将统
计数
据与每个观察相关联:N <- 1000 tf <- data.fra
浏览 2
提问于2014-06-11
得票数 8
回答已采纳
1
回答
SQL Server:在每个
类别
中选择
前
N个记录:Count-Rank-在一个脚本中选择
sql
、
sql-server
Existing questions已经有了每个
类别
的底层
计数
,然后考虑如何在每个
类别
中选择
前
10名,但是否可以在一个脚本中端到端地执行这一操作,即按
类别
计数
,按
类别
排名,然后选择每个
类别
前
10名?我已经完成了
前
两个步骤,现在想知道如何合并第三个步骤,即在同一个脚本中选择
前
N个结果: ;with cte as select day(t
浏览 21
提问于2019-06-19
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
快速掌握R语言中类SQL数据库操作技巧
必学包之dplyr包
R可视化分析美国的肥胖症,嘿!
利用excel多输入源自动化生成建筑参数
在Python中进行探索式数据分析
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券