腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
为
dplyr
中
的
每个
组
创建
具有
相等
样本
大小
的
数据
帧
r
、
tidyverse
当我有像这样
的
数据
帧
时: structure(list(event = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, )), row.names = c(NA, -100L), class = c("tbl_df", "tbl", "data.frame" <lgl> &l
浏览 22
提问于2021-08-12
得票数 0
回答已采纳
6
回答
使用特定于
组
的
样本
大小
从
数据
帧
中
获取示例。
r
、
dplyr
、
sample
我希望使用来自
每个
组
的
不等
样本
大小
从
数据
帧
中
采样行。假设我们有一个按‘group’分组
的
简单
数据
框架:set.seed(123) df <- data.frame(group = rep(c("A", "B"), each函数,您可以很容易地将
大小
相等
的
组</
浏览 0
提问于2021-03-04
得票数 7
回答已采纳
2
回答
R:从
组
中
随机抽取
r
我不确定标题是否清楚,但我有一个包含1000个家庭观察
的
数据
框架,其中一些家庭有一个成员,一些家庭有两个成员。我需要将
数据
帧
划分为两个
大小
相等
的
数据
帧
,而不是将来自同一个家庭
的
个体放在同一子集中。
数据
帧
在功能上如下所示。1,2,2,3,3,4,4,5,6,6,7,8)df <- as.data.
浏览 22
提问于2017-07-18
得票数 2
回答已采纳
1
回答
用R
创建
具有
特定行数
的
数据
帧
json
、
r
、
csv
、
dplyr
我有一个大
的
json文件,
大小
超过2GB。由于
数据
大小
非常大,所以我无法
创建
具有
整个
数据
集
的
数据
帧
。我希望解析特定
的
信息并写入CSV文件。 因此,我正在寻找一些技术来
创建
具有
特定行数
的
数据
帧
。假设我在将json解析
为
数据
帧
时有200万行,我想要
创建<
浏览 2
提问于2017-06-23
得票数 0
2
回答
自定义分组
dplyr
函数(sample_n)
r
、
dplyr
、
sample
我正在尝试以分组
的
方式将采样函数应用于
数据
帧
,其中它应该对
每个
组
中
的
n个
样本
进行采样,或者如果
组
大小
小于n,则对所有组成员进行采样。使用
dplyr
,我首先尝试mtcars %>% group_by(cyl) %>% sample_n(2) 当n小于所有的
组
大小
时,这是有效
的
,但当我选择
浏览 93
提问于2019-04-14
得票数 5
回答已采纳
3
回答
dplyr
sample_n按
组
划分,
每个
组
具有
唯一
的
大小
参数
r
、
dplyr
我试图从存在变量
的
数据
集中绘制分层
样本
,该
数据
集指示
每个
组
的
样本
大小
应该有多大。library(
dplyr
)df <- data.frame(id = 1:15,在本例
中
,grp指的是我想要抽样
的
<
浏览 1
提问于2018-08-03
得票数 4
回答已采纳
2
回答
在
dplyr
中使用
r
、
dplyr
、
approximation
我试图用点id对year之间
的
数据
帧
中
的
每个
x进行线性近似。对于这一点,
dplyr
似乎是一个合适
的
选项,但是由于一个错误,我无法让它工作: library(
dplyr
) mutate(x2 = as.numeric
浏览 1
提问于2016-04-28
得票数 3
回答已采纳
3
回答
如何对大型
数据
库进行采样,在R
中
实现K-均值和K-nn?
r
、
machine-learning
、
k-means
、
knn
、
large-data
我是R
的
新用户,试着离开SAS。我在这里问这个问题,因为我对所有可供R使用
的
软件包和源代码感到有点沮丧,而且我似乎无法主要由于
数据
大小
而使其工作。我有以下几点: 随机抽样源
数据
库,以
创建
一个较小
浏览 6
提问于2012-12-02
得票数 13
1
回答
R-Studio过滤
数据
r
、
dplyr
、
filtering
我有这个
数据
表作为模型:1 BED Y Ysubset1<- data2 %>% sample_frac(
浏览 0
提问于2021-06-01
得票数 0
2
回答
dplyr
如何在group_by操作后为
每个
组
生成
数据
帧
?
r
、
dplyr
对于
dplyr
包在流式
数据
处理
中
的
流畅性,我感到非常震惊.最近,我遇到了一个问题,
为
每个
组
ID生成一个新
的
数据
帧
,并将这些小
数据
帧
组合成一个最终
的
更大
的
数据
帧
。在
dplyr
中
,函数mutate
为
每个
组
添加新列,summar
浏览 5
提问于2014-11-07
得票数 7
回答已采纳
1
回答
在R中有没有一种方法可以使用
dplyr
包对相同数量
的
因子进行采样?
r
、
dplyr
我有以下
数据
帧
: > testing type mmr 1 Public 100 7 Public 100 9 Public 100# ... with 27,497 more rows 此
数据
帧
具有
以下计数tibble: 2 x 2
浏览 13
提问于2020-04-26
得票数 0
回答已采纳
2
回答
布尔向量
的
随机
样本
r
我有一个带有布尔值
的
输入向量vi。我想从值
为
真的向量
中
随机抽取一个
大小
为
n
的
样本
,因此最终
的
向量vf
具有
以下属性 向量
的
长度是
相等
的
,length(vf) == length(v0)vf有n真值,vf
中
的
真值不能超过v0 n <=和(V0)
中
的
真值,在vi
中
,vf
中
<e
浏览 0
提问于2011-10-12
得票数 2
回答已采纳
4
回答
使用
dplyr
从dataframe
中
抽取子
组
的
样本
行
r
、
dplyr
、
sample
如果我想从不同
的
组
中
随机选择一些
样本
,我可以使用plyr包和下面的代码sampleGroup<-function(df,size) {这里从
每个
物种中选择10个
样本
。我
的
一些
数据
帧
非常大,我
的
问题是,我可以在
dplyr
包中使用相同
的
浏览 26
提问于2014-01-21
得票数 31
1
回答
分组差别化采样率
r
、
group-by
、
dplyr
、
sampling
对于机器学习模型训练,我尝试对
具有
分组变量
的
数据
帧
进行采样,以便用不同
的
采样规则处理
每个
组
。例如,我
的
数据
:对于规模小于3
的
组
,我想取整个
组
而不是更多,对于更大
浏览 7
提问于2019-10-30
得票数 2
回答已采纳
1
回答
利用地图约简实现水库采样
mapreduce
、
sampling
我觉得他们
的
解决方案很复杂,下面的更简单
的
方法是可行
的
。 减少操作:在所有拥有相同密钥
的</e
浏览 0
提问于2013-08-10
得票数 0
回答已采纳
2
回答
删除R
中
每个
组
中
的
每一行
r
我需要在应用group_by之后删除
组
中
的
最后一行。我试过这样
的
方法,但不起作用。data=data %>% summarise(data=data[-length(isin),]) 谢谢你
的
帮忙!
浏览 1
提问于2021-01-22
得票数 0
回答已采纳
1
回答
R
中
没有替换
的
多个
样本
r
、
random
、
subset
我有一个大约20000个客户
的
数据
集和一些分类
的
指标变量。我正在尝试
创建
20
组
1000个独特
的
客户。我最初
的
想法是在没有替换
的
情况下采集20个
样本
,但我发现很难重复采样。这是我最初想到
的
代码,但它需要我重复这个过程20次,这似乎非常笨拙。有没有人想过一种更简单
的
方法来
创建
数据
的
子集,而不需要替换?
浏览 3
提问于2021-05-30
得票数 0
2
回答
R
中
入库
数据
帧
的
直方图
r
、
dataframe
、
histogram
、
bin
我
的
来自python代码
的
(巨大)
数据
帧
由
每个
样本
的
不同
大小
类
的
计数组成,如下所示:colnames), sep = "."))dummy[, -1] <- rep(round(abs(rnorm(11))*1000,0), 10)
浏览 3
提问于2013-08-14
得票数 2
1
回答
如何为R
中
的
多个列
创建
分层采样
r
、
cluster-analysis
、
sampling
我
的
数据
集有821049个变量和18列。我想采取9列进行分层抽样。我
的
分层变量是ID = 1:821049。如何选择变量
的
间隔?如何设置采样
大小
?
浏览 22
提问于2020-04-03
得票数 1
1
回答
从
数据
中
抽取
样本
,保存来自抽样
组
的
所有观察结果
r
、
dplyr
我有一个问题,如何获得一个随机
样本
,但维护多个项目,属于同一
组
。我真正想做
的
是做抽样,但
每个
样本
必须包括每一项。 mutate(number = rep(1:8,each=4)) %>% sample_n(2) 最后两
浏览 2
提问于2022-11-18
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
必学包之dplyr包
pandas系列学习(五):数据连接
Python中的统计假设检验速查表
当论文用到统计学,什么时候用T检验,什么时候用F检验呢?
通过这10个教程学习Maya的基础知识(二)
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券