腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
dplyr
中
group_by
的
另一
个大
数据
问题
、
、
我
的
数据
帧中有大约一百万行和许多列。我需要一个
group_by
和mutate来清理我
的
数据
。我将缺少
的
值(负数)归因于特定个人或组
的
任何其他正值。data$x[3] <- -1 # negative numbers represent missings data$x[12] <- -1
group_by
bigdata = data.frame(id=rep(c(1:1
浏览 15
提问于2019-11-22
得票数 0
回答已采纳
1
回答
将函数应用于
dplyr
的
group_by
输出
、
、
我想要子集一
个大
的
数据
,并创建一个每个分组
的
全球图表。听起来是
dplyr
的
完美候选,但我遇到了调用
group_by
结果上
的
函数
的
问题
。任何提示都将不胜感激。geom_point())} # I'm trying to get something like this using
浏览 1
提问于2014-12-18
得票数 3
回答已采纳
1
回答
为什么R
中
的
group_by
()函数不能正常工作?
、
、
我有一
个大
型
的
dataframe,我试图在一个列
中
按8个类别进行排序,然后使用
group_by
()查找它们
的
权重之和(kg),并总结来自
dplyr
包
的
函数。然而,在创建
的
“总”变量
中
,某些类别的和产生N/A,我不知道为什么,因为它们应该是数值。我能看到
的
数据
没有什么奇怪
的
地方。代码: totals <- db %>%
group_by
(cat
浏览 3
提问于2022-08-09
得票数 0
2
回答
dplyr
函数
group_by
错误
、
、
我对库
dplyr
的
一个函数有
问题
。我想按不同
的
值("
group_by
")对
数据
帧进行分组。这些值
中
的
一些是固定
的
(总是相同
的
),
另一
些是通过向量引入
的
。这个向量
的
维度是可变
的
。当
数据
帧被分组时,我想要应用函数“变异体”。 我试过用不同
的
方法来做这件事。第一个被复制到下面,其中包括一个遍历向量
浏览 1
提问于2017-11-28
得票数 4
2
回答
在
dplyr
R中有条件地将列添加到groupby
、
这个
问题
-- --与我
的
问题
有关,但我不认为答案是令人满意
的
。are always in data
dplyr
::
group_by
(player, team, game, season) %>%} 我
的
问题
是-我只想在game时添加some_condition ==
浏览 0
提问于2018-12-21
得票数 0
回答已采纳
1
回答
删除
dplyr
::
group_by
后和prcomp之前
的
等方差列
、
、
我使用
dplyr
在一
个大
型
数据
集中为多个组执行pcas。当使用
group_by
函数将
数据
分割成组时,一些变量具有相等
的
方差,因此pca无法运行。如何删除任何方差相等
的
列,然后对剩余
的
内容执行prcomp?下面是假
数据
。谢谢。尝试以等方差运行pcas > iris%
浏览 0
提问于2019-09-24
得票数 1
回答已采纳
1
回答
在R
中
定义函数时,如何统计一列
中
的
观察值数量?
、
、
、
、
我正在尝试定义一个函数,它将接受两个参数,并且将根据
另一
列(The_words)计算给定
数据
帧
的
列(Morph_column)
中
的
括号数量。之后,我需要计算长度列
中
的
观察值
的
数量,例如,如果"the_words“返回
的
括号数量为1,我需要知道
数据
帧中有多少项具有相同
的
长度(1)。2,3,4,5
的
观测值也是如此。当我尝试在
dplyr
中使用n()时,它告诉我
浏览 81
提问于2021-06-17
得票数 1
回答已采纳
1
回答
来自组
的
样本,并且只在
数据
中保持独特
的
观测。
、
、
、
我有一个
数据
模型,其中一些参与者(并非全部)出现两次,每次出现在不同
的
组
中
,即v1=A和v2=1组
中
,理论上也可以出现在v1=B和v2=3组
中
,一个组是由v1和v2两个变量定义
的
,因此根据下面的代码,共有现在,我希望避免
数据
中
任何参与者
的
双重外观,方法是每组抽取样本,随机删除任何参与者
的
一个观察结果,同时保持相同大小
的
样本。我构造了下面的丑陋代码来展示我
的
问题
。如
浏览 2
提问于2018-04-16
得票数 1
回答已采纳
2
回答
group_by
+变异
中
的
过滤器不像
dplyr
中
的
group_by
+摘要那样工作
、
当筛选使用tidyverse变异
数据
时,我遇到了
问题
。,直接使用概述,正确地应用了过滤器:
dplyr
::
group_by
(group) %>% 1 A 3desired.df <- sample.df %&g
浏览 2
提问于2020-06-11
得票数 1
回答已采纳
3
回答
R,
dplyr
-
group_by
()和of ()
的
组合不会产生预期
的
结果?
、
在使用
dplyr
函数
group_by
()时,以及在使用
dplyr
函数arrange()之后,我希望得到一个输出,其中
数据
帧是在我在
group_by
()
中
声明
的
组中排序
的
。我对文档
的
解读是,这种组合应该会产生这样
的
结果,但是当我尝试时,这不是我得到
的
结果,而且googling没有表明其他人遇到了相同
的
问题
。我预期这个结果是错误
的
吗?下面是一个示例,
浏览 5
提问于2014-07-09
得票数 50
回答已采纳
2
回答
group_by
()级别在未使用ungroup
的
filter()/mutate()/count()之后消失
、
问题
是,
group_by
级别将在筛选器()、mutate()、count()等一行代码之后消失,为了保持该级别,我需要每次在这些代码之后添加
group_by
()以保持组级别。下面我附上一个例子。正如您所看到
的
,如果我在过滤器之后添加
group_by
,它可以正常工作。1编辑:在我将R版本更新到4.0.2 (我以前<
浏览 4
提问于2020-11-20
得票数 1
1
回答
基于样本均值
的
分组条件抽样
、
、
、
我试着用R来做一系列不同
的
小测验。我有一
个大
型
数据
集(quiz_df),其中包含许多
问题
,分为类别和困难,如下所示:1 1library(
dplyr
)这就产生了一个随机
的
小测验集,每个类别有3个
浏览 2
提问于2022-02-03
得票数 1
回答已采纳
6
回答
计算不同因素组合
的
行数
、
考虑到像经典
的
mtcars这样
的
数据
集,我想知道不同级别的因素
的
观察数(=行),并将它们分开以及放在一起。mtcars %>%
dplyr
::
group_by
(cyl, gear) %>%
dplyr
::summarise(N = n()) 我知道,对于cyl和gear,可以通过类似的方式获得单独
的
观察数,创建单独
的
数据
格式,并将所有
数据
合并在一起。以下内容将产生预期
的</em
浏览 6
提问于2020-01-31
得票数 2
回答已采纳
2
回答
来自`
dplyr
:::print.tbl_df`
的
“本地
数据
帧”消息
的
含义是什么?
、
、
当使用
dplyr
时,tbl_df函数打印一条语句,表示
数据
框架是“本地
的
”:+
group_by
(gear) Source: local data frame [32我认为本地
数据
帧意味着内存
中
的
数据
,而非本地
数据
帧是类似于SQL
的
数据
库。不过,我觉得我
的
假设是错
的
。在这
个大
约25:25
的
浏览 4
提问于2015-03-16
得票数 24
3
回答
如何在函数中加入基于Vector
的
数据
帧行
的
重新排序
、
library(tidyverse)我
的
函数在运行时遇到了
问题
。我试图做
的
是,在本例中使用钻石
数据
集表单ggplot2,对“
dplyr
::
group_by
”和"color“进行”剪切“和”
dplyr
::
group_by
“,然后使用
dplyr
::summarise获取计数我使用rlang和purrr将两个计数
的
摘要输出到list<e
浏览 30
提问于2018-02-04
得票数 4
回答已采纳
1
回答
在R
中
这个For循环有
问题
吗?
我尝试在R中使用这个For循环创建一个从电子表格
中
的
7列接收
数据
的
DB,但它不起作用。data.frame(a=a, b=b)} 'a‘表示创建从电子表格
的
第一列接收
数据
的
列“b”从第二列到第六列接收
数据
。"Dados“正在创建
数据
帧。"RESUMOVE
浏览 0
提问于2019-02-19
得票数 0
1
回答
purrr::map()一个深度嵌套
的
列表,用于测试
数据
帧
的
相等性
、
、
问题
我有一个列表,其中包含多组嵌套列表。我需要测试最低级别
中
的
所有
数据
帧是否都相等,并且在执行此测试时需要尊重
数据
的
分组。我正在尝试使用purrr::map()来解决这个
问题
,但是我真的很难理解如何遍历每个子列表。 我在这个例子中使用gapminder只是因为它可以嵌套两次,这与我
的
实际
数据
相同(我不能在这里分享)。
数据
library(
dplyr
)libr
浏览 31
提问于2020-11-03
得票数 0
回答已采纳
2
回答
创建一个用前导变量追加列
的
循环
、
、
我
的
数据
框架包含以下列:日期、id、类别。我希望创建一个循环,该循环附加附加列(category1、category2等),其中包含按日期划分
的
每个id
的
前导类别。没有循环
的
代码如下所示:
dplyr
::
group_by
(id) %>%
浏览 4
提问于2022-09-22
得票数 0
回答已采纳
1
回答
我如何
group_by
,总结,然后选择最小和最大?
、
、
0.60 35010 0.79 235012 1.00 4850min <- df %>%
dplyr
::
group_by
(claim_x) %>%
dplyr
::summarise(Fx=min(Fx))max <- po
浏览 2
提问于2019-06-18
得票数 1
回答已采纳
1
回答
按R
中
的
多列分组
、
、
、
我正在尝试创建一个包含多个变量
的
表 我使用了
dplyr
包
中
的
group_by
,但它没有提供我想要
的
东西。 excel
数据
透视表
中
的
例子给出了我想要
的
结果。 ? R不是像excel
数据
透视表那样对它们进行分组,而是按观察值返回。 这是我用来从
dplyr
包
中
group_by
然后总结
的
代码。Update_Cc_X2 %>%
浏览 13
提问于2021-04-12
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券