为dplyr中的每个组创建具有相等样本大小的数据帧_为列表中的每个值创建数据帧_为RStudio中的每个参与者创建具有3个数据帧的每个参与者ID列表 - 腾讯云开发者社区

r、tidyverse

当我有像这样的数据帧时： structure(list(event = c(1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, )), row.names = c(NA, -100L), class = c("tbl_df", "tbl", "data.frame" <lgl> &l

浏览 22提问于2021-08-12得票数 0

回答已采纳

6回答

使用特定于组的样本大小从数据帧中获取示例。

r、dplyr、sample

我希望使用来自每个组的不等样本大小从数据帧中采样行。假设我们有一个按‘group’分组的简单数据框架：set.seed(123) df <- data.frame(group = rep(c("A", "B"), each函数，您可以很容易地将大小相等的组</

浏览 0提问于2021-03-04得票数 7

回答已采纳

2回答

R:从组中随机抽取

我不确定标题是否清楚，但我有一个包含1000个家庭观察的数据框架，其中一些家庭有一个成员，一些家庭有两个成员。我需要将数据帧划分为两个大小相等的数据帧，而不是将来自同一个家庭的个体放在同一子集中。数据帧在功能上如下所示。1,2,2,3,3,4,4,5,6,6,7,8)df <- as.data.

浏览 22提问于2017-07-18得票数 2

回答已采纳

1回答

用R创建具有特定行数的数据帧

json、r、csv、dplyr

我有一个大的json文件，大小超过2GB。由于数据大小非常大，所以我无法创建具有整个数据集的数据帧。我希望解析特定的信息并写入CSV文件。因此，我正在寻找一些技术来创建具有特定行数的数据帧。假设我在将json解析为数据帧时有200万行，我想要创建<

浏览 2提问于2017-06-23得票数 0

2回答

自定义分组dplyr函数(sample_n)

r、dplyr、sample

我正在尝试以分组的方式将采样函数应用于数据帧，其中它应该对每个组中的n个样本进行采样，或者如果组大小小于n，则对所有组成员进行采样。使用dplyr，我首先尝试mtcars %>% group_by(cyl) %>% sample_n(2) 当n小于所有的组大小时，这是有效的，但当我选择

浏览 93提问于2019-04-14得票数 5

回答已采纳

3回答

dplyr sample_n按组划分，每个组具有唯一的大小参数

r、dplyr

我试图从存在变量的数据集中绘制分层样本，该数据集指示每个组的样本大小应该有多大。library(dplyr)df <- data.frame(id = 1:15,在本例中，grp指的是我想要抽样的<

浏览 1提问于2018-08-03得票数 4

回答已采纳

2回答

在dplyr中使用

r、dplyr、approximation

我试图用点id对year之间的数据帧中的每个x进行线性近似。对于这一点，dplyr似乎是一个合适的选项，但是由于一个错误，我无法让它工作： library(dplyr) mutate(x2 = as.numeric

浏览 1提问于2016-04-28得票数 3

回答已采纳

3回答

如何对大型数据库进行采样，在R中实现K-均值和K-nn？

r、machine-learning、k-means、knn、large-data

我是R的新用户，试着离开SAS。我在这里问这个问题，因为我对所有可供R使用的软件包和源代码感到有点沮丧，而且我似乎无法主要由于数据大小而使其工作。我有以下几点：随机抽样源数据库，以创建一个较小

浏览 6提问于2012-12-02得票数 13

1回答

R-Studio过滤数据

r、dplyr、filtering

我有这个数据表作为模型：1 BED Y Ysubset1<- data2 %>% sample_frac(

浏览 0提问于2021-06-01得票数 0

2回答

dplyr如何在group_by操作后为每个组生成数据帧？

r、dplyr

对于dplyr包在流式数据处理中的流畅性，我感到非常震惊.最近，我遇到了一个问题，为每个组ID生成一个新的数据帧，并将这些小数据帧组合成一个最终的更大的数据帧。在dplyr中，函数mutate为每个组添加新列，summar

浏览 5提问于2014-11-07得票数 7

回答已采纳

1回答

在R中有没有一种方法可以使用dplyr包对相同数量的因子进行采样？

r、dplyr

我有以下数据帧： > testing type mmr 1 Public 100 7 Public 100 9 Public 100# ... with 27,497 more rows 此数据帧具有以下计数tibble: 2 x 2

浏览 13提问于2020-04-26得票数 0

回答已采纳

2回答

布尔向量的随机样本

我有一个带有布尔值的输入向量vi。我想从值为真的向量中随机抽取一个大小为n的样本，因此最终的向量vf具有以下属性向量的长度是相等的，length(vf) == length(v0)vf有n真值，vf中的真值不能超过v0 n <=和(V0)中的真值，在vi中，vf中<e

浏览 0提问于2011-10-12得票数 2

回答已采纳

4回答

使用dplyr从dataframe中抽取子组的样本行

r、dplyr、sample

如果我想从不同的组中随机选择一些样本，我可以使用plyr包和下面的代码sampleGroup<-function(df,size) {这里从每个物种中选择10个样本。我的一些数据帧非常大，我的问题是，我可以在dplyr包中使用相同的

浏览 26提问于2014-01-21得票数 31

1回答

分组差别化采样率

r、group-by、dplyr、sampling

对于机器学习模型训练，我尝试对具有分组变量的数据帧进行采样，以便用不同的采样规则处理每个组。例如，我的数据：对于规模小于3的组，我想取整个组而不是更多，对于更大

浏览 7提问于2019-10-30得票数 2

回答已采纳

1回答

利用地图约简实现水库采样

mapreduce、sampling

我觉得他们的解决方案很复杂，下面的更简单的方法是可行的。减少操作:在所有拥有相同密钥的</e

浏览 0提问于2013-08-10得票数 0

回答已采纳

2回答

删除R中每个组中的每一行

我需要在应用group_by之后删除组中的最后一行。我试过这样的方法，但不起作用。data=data %>% summarise(data=data[-length(isin),]) 谢谢你的帮忙!

浏览 1提问于2021-01-22得票数 0

回答已采纳

1回答

R中没有替换的多个样本

r、random、subset

我有一个大约20000个客户的数据集和一些分类的指标变量。我正在尝试创建20组1000个独特的客户。我最初的想法是在没有替换的情况下采集20个样本，但我发现很难重复采样。这是我最初想到的代码，但它需要我重复这个过程20次，这似乎非常笨拙。有没有人想过一种更简单的方法来创建数据的子集，而不需要替换？

浏览 3提问于2021-05-30得票数 0

2回答

R中入库数据帧的直方图

r、dataframe、histogram、bin

我的来自python代码的(巨大)数据帧由每个样本的不同大小类的计数组成，如下所示：colnames), sep = "."))dummy[, -1] <- rep(round(abs(rnorm(11))*1000,0), 10)

浏览 3提问于2013-08-14得票数 2

1回答

如何为R中的多个列创建分层采样

r、cluster-analysis、sampling

我的数据集有821049个变量和18列。我想采取9列进行分层抽样。我的分层变量是ID = 1:821049。如何选择变量的间隔？如何设置采样大小？

浏览 22提问于2020-04-03得票数 1

1回答

从数据中抽取样本，保存来自抽样组的所有观察结果

r、dplyr

我有一个问题，如何获得一个随机样本，但维护多个项目，属于同一组。我真正想做的是做抽样，但每个样本必须包括每一项。 mutate(number = rep(1:8,each=4)) %>% sample_n(2) 最后两

浏览 2提问于2022-11-18得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云