腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
dplyr
根据
低于
特定
值
的
观察
值
数量
删除
组
、
"Year"=c(1,2,3,1,2,3,4,5,1,2,3), "Count"=c(5,0,0,10,15,8,0,6,0,0,10)) 我正在尝试弄清楚如何
根据
非零计数
的
数量
删除
整个
组
具体地说,我希望
删除
只有一个非零计数
的
组
,并保留所有其他具有多个非零计数
的
组
。在此
特定
示例中,最终结果将如下所示: df <- tibble(
浏览 4
提问于2021-01-22
得票数 0
回答已采纳
1
回答
如何在R中
使用
filter和str_detect筛选部分匹配对
的
数据?
、
、
、
我正在尝试筛选具有匹配
组
的
数据,如果它们没有匹配
组
,我希望
删除
这些
观察
值
。#9 pear_1 A small#11 pear_3 A small 在这里,我决定每个苹果
观察
值
必须通过它们
的
编号与每个
观察
值
配对因此,我们可以看到,由于只有一个pear_2
观察
值
浏览 25
提问于2021-06-03
得票数 0
回答已采纳
1
回答
每组保持随机行,但每组保持不同
的
行数。
、
、
、
来自package
dplyr
的
函数()允许随机保留
特定
的
行数。例如,结合group_by(),您可以保留每个
组
的
2个
观察
结果: select(vs, drat) %>% sample_n(22] <dbl> <dbl>2 0 3.9 4 1 3
浏览 3
提问于2020-01-13
得票数 1
回答已采纳
1
回答
在R中
使用
dplyr
进行过滤时返回整组
、
如果一个小组
的
观察
至少有一个符合过滤标准,我想返回该小组内
的
所有
观察
结果。 test <- data.frame('prod_i
浏览 0
提问于2019-01-22
得票数 0
回答已采纳
1
回答
我想
根据
匹配
的
时间戳将一个数据帧中
的
某些行替换为另一个数据帧中
的
行(两个数据帧在同一个tz中都有时间戳)
、
、
我希望能够从一个dataframe中获取一些
值
,并将这些
值
插入到另一个dataframe中(两者具有相同
数量
的
具有相同标题
的
列)。我希望dataframe 1中每一行中
的
值
根据
匹配
的
时间戳替换dataframe 2中
的
值
。对于大多数行/时间戳,我希望原始数据保留在dataframe 1中,因此这只针对一
组
特定
的
时间戳(在datafram
浏览 14
提问于2021-08-13
得票数 0
1
回答
n=n( )在R中是什么意思?
、
、
library(
dplyr
) net.multiplicity <- group_by(net, nodeid, epoch) %>% summarise(n=n()) %>%
浏览 3
提问于2014-09-16
得票数 9
1
回答
在R中定义函数时,如何统计一列中
的
观察
值
数量
?
、
、
、
、
我正在尝试定义一个函数,它将接受两个参数,并且将
根据
另一列(The_words)计算给定数据帧
的
列(Morph_column)中
的
括号
数量
。之后,我需要计算长度列中
的
观察
值
的
数量
,例如,如果"the_words“返回
的
括号
数量
为1,我需要知道数据帧中有多少项具有相同
的
长度(1)。2,3,4,5
的
观测
值
也是如此。当我尝试在
dply
浏览 81
提问于2021-06-17
得票数 1
回答已采纳
1
回答
如何生成组之间成对共享
的
矩阵并将其可视化
、
、
、
、
组
内没有重复
的
观测
值
,但在整个数据集中
组
之间有许多重复
的
观测
值
。我想要两
组
之间有多少重复
观察
的
成对矩阵。Bat 3 Night Bat 3 Night Deer 2 Night (在A
组
和B
组
) 我最接近
的
是这段代码,它没有创建成对矩阵,而是列出了共享
的
观察
值
如果有人能给我如何在<
浏览 11
提问于2020-04-29
得票数 1
回答已采纳
2
回答
根据
观察
值
的
数量
删除
变量
我有一个包含大约1000个变量
的
SPSS文件,我必须
删除
有效
值
为0
的
变量。我可以想到一个带有if语句
的
循环,但我找不到如何编写它。
浏览 2
提问于2016-02-12
得票数 2
1
回答
按R
组
统计符合
特定
标准
的
观测
值
、
、
我需要一些帮助,按
组
计算符合
特定
标准
的
观察
值
。首先,我希望将按位置划分
的
雇员
数量
作为一列。然后,我想检索工作超过40小时(按位置)
的
员工
数量
,并将其汇总到一个列中。我假设有一个简单
的
方法可以用
dplyr
或base R来完成,但是我被难住了。我
的
数据如下。WIBrad 60 OH Sam
浏览 12
提问于2021-09-15
得票数 1
回答已采纳
3
回答
如何
使用
dplyr
过滤出具有满足
特定
属性
的
列
的
整个
组
?
、
、
以mtcar为例:假设我想
删除
基于"carb“列
的
组
,如果
组
中
的
任何
观察
值
的
"disp”小于100。我知道如何
使用
base R执行此操作: data(mtcars)xx <- xx[sapply (xx, function(x) min(x$disp) > 100)] xx <- do.call
浏览 11
提问于2020-03-24
得票数 0
回答已采纳
2
回答
对附近观测
值
的
求和
、
、
我有一个很大
的
data.frame,其中包括商品
的
价格和每个价格售出
的
数量
。我喜欢找到与每行价格相似(在一个范围内)
的
销售商品
的
总
数量
。例如,对于第j个
观察
(行),我喜欢找出价格
低于
Price_j+50且高于Price_j-50
的
商品
数量
之和,对于其他
观察
结果也是如此。我可以在
观察
值
上运行for循环,并
根据
每个
观察</e
浏览 0
提问于2019-07-25
得票数 1
2
回答
基于
组
的
新列
的
变异
、
、
是否有一种方法可以
根据
公共列
值
(id)将行分组,然后
根据
每个
组
中值是否在1000以上和/或
低于
1000
的
情况,用新id (new.id)对新列进行变异?例如: < 1000 = "low/low" (其中该
组
中
的
所有
值
都
低于
1000)< 1000 and > 1000 = "low/high" (其中一些
值
<e
浏览 1
提问于2020-11-10
得票数 1
1
回答
在
dplyr
中仅按一个变量分组后取消分组
、
我有很多重复测量
的
单位。
dplyr
来
删除
观察
值
数量
较少
的
值
。在这个玩具数据上,假设我想
删除
计数少于2
的
数据 group_by(Item) %>% filter(n>1) 125 2 问题是,我想把它扩展回原来
的
样子,但
使用
这个过滤器。
浏览 0
提问于2017-07-28
得票数 14
回答已采纳
1
回答
使用
dplyr
中
的
组长度创建新列
、
我正在尝试创建一个新
的
数据框,它由一个列(即下面的Petal.Width )分组,并具有从另一个变量(即物种)
的
组
创建
的
新列,以及来自每个物种
组
的
观察
值
的
数量
。我假设
dplyr
能够做到这一点,但是我不能完全得到我需要
的
东西。我试过这个代码,但它返回物种中所有
观察
值
的
长度,而不是每组
的
长度(即所有列都有相同<em
浏览 12
提问于2019-08-24
得票数 0
1
回答
根据
另一个数据提取群
的
第一个N个观测
值
、
、
、
我想从数据中提取不同群体
的
第一批
观察
结果。观测
的
数量
来自另一个数据。 下面是一个例子:在dataframe "x“中,有不同种类
的
动物
的
名字。,加上我希望对各自组进行
的
观察
的
数量
。,对猫第一次
观察
,对猫第一次
观察
,对狗第一次
观察
,对鸟类最后第一次
观察
前两次。
dplyr
,按“动物”分组,然后
使用
head
浏览 4
提问于2022-04-02
得票数 2
回答已采纳
1
回答
可以为R中
的
mvrnorm( )随机生成
的
数字指定一个范围吗?
、
、
、
我正在尝试生成一
组
随机
的
数字,这些数字精确地反映了我拥有的数据集(以测试它)。数据集由5个变量组成,这些变量都与不同
的
均值和标准差以及范围(它们是likert标度相加形成1个变量)相关。我已经能够从MASS包中获得mvrnorm来创建一个数据集,该数据集复制了具有
观察
到
的
观测
值
数量
的
相关矩阵(在500,000+迭代之后),并且我可以轻松地重新分配均值和标准差。dev.通过z分数转换,但我仍然在每个变量向量中有
特定
值
,
浏览 0
提问于2013-07-07
得票数 1
回答已采纳
1
回答
合并具有相同ID但变量重叠
的
行
、
、
、
我在r中有超过6000个
观察
值
和96个变量
的
数据。数据包含个人
数量
、活动、影响、到达时间等。问题是,一些
观察
结果被分成两行,因此可能存在在另一行中为同一
组
记录
的</
浏览 14
提问于2020-02-03
得票数 0
回答已采纳
2
回答
不平衡数据集
的
变量创建
我有一个数据集,其中
的
观测
值
是ID year event_type event_date。每个ID year
的
观察
值
数量
不平衡。具体地说,这些都是冲突年份内
的
战斗结果。我想做
的
是
根据
ID year
的
子集内
特定
类型
的
事件
数量
创建一个变量。所以:作者:year我知道如何
使用
常规
的
f
浏览 1
提问于2012-03-06
得票数 0
回答已采纳
1
回答
根据
另一个变量
的
中位数创建二进制变量,按两个变量分组
、
、
、
、
在Stata中,我想
根据
另一个变量median_unemp
的
中值创建一个二进制变量unemp,将中值
的
计算按region和year分组。也就是说,当
特定
观测
值
的
失业率大于该地区和
观察
年份
的
失业率中位数(否则为0)时,median_unemp为1。考虑到整个数据集,下面的代码生成我
的
变量,但我希望通过子
组
(由region和year计算)计算中间
值
: webuse productivity.dta, c
浏览 6
提问于2021-12-14
得票数 0
回答已采纳
点击加载更多
相关
资讯
排序和去重 数据处理
Python中优雅遍历字典并删除元素的方法
Dropout可能要换了,Hinton等研究者提出神似剪枝的Targeted Dropout
手把手教你用R语言分析歌词
R语言进行相关矩阵分析及其网络可视化
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券