腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
4
回答
从
其他
数据
帧
的
子
集中
获取
随机样本
、
、
我有一个100,000行
的
大
数据
框,我想添加一个列,其中值是基于
数据
框中常见名称
的
另一个
数据
框
的
子集
的
样本。用例子来解释可能更容易。,'y','y','y'), sample = 1:10) 然后,我想将一个新列sample添加到largeDF,它是sampleDF中colA和colB
的
适当子集
的
sample列
的
浏览 24
提问于2017-05-24
得票数 1
回答已采纳
1
回答
R Studio查询定义
train.indices <- sample(1:nrow(iris), 100)是做什么
的
? 谢谢。
浏览 0
提问于2020-01-04
得票数 0
1
回答
在dplyr,R中取一个没有分组
的
样本。
、
、
、
我知道如何使用dplyr中
的
sample_n或sample_frac
从
数据
中抽取每个组
的
随机样本
,可以这样做, group_by(user_id) %>%然而,我有一个稍微不同
的
问题。我想从整个
数据
集中
随机抽取一个样本。第二个命令相当于这里
的
第一个命令。 我想知道如何消除group_by
的
影响,
从
整个
数据
<em
浏览 2
提问于2016-08-18
得票数 2
回答已采纳
1
回答
如何每次
从
数据
集中
抽取相同
的
随机样本
、
、
我有一个由近700万个观测
数据
组成
的
数据
集,我想要随机抽取
数据
样本来分析一个子集。我知道如何对
数据
进行随机抽样:flights <- flight[index, ] 是否有一种方法来
获取
一个
随机样本
,但一旦在我
的
数据
集中
创建,总是给我相同
的
随机样本
?我希望这样做,而不必依赖于拯救我
的
R项
浏览 0
提问于2015-06-07
得票数 3
回答已采纳
1
回答
从
数据
集中
获取
加权
随机样本
、
、
我想每60秒对这份名单上
的
每个国家进行分析。但是我不能--我使用
的
服务(Twitter )是有限
的
。因此,我将随机选择50个国家中
的
15个,其中GDP加权最多
的
国家是有利
的
,GDP加权最少
的
国家则是较少
的
。我使用
的
是这个函数($values和$weights是上述
数据
解析中
的
第1列和第2列)* getSample() * Pick a random item based on w
浏览 1
提问于2014-09-26
得票数 1
回答已采纳
3
回答
数据
帧
的
多个不同行
的
子集
嗨,我如何在一个
数据
帧
中设置2个不同
的
N个
随机样本
。请参见下面的示例。 我已经定义了主
数据
集。我需要主
数据
集
的
两个子集。我
从
主
数据
集中
随机
获取
了3行
数据
,得到了2个子集。
浏览 0
提问于2019-03-25
得票数 1
2
回答
如何使用python上
的
索引列表
从
列表中删除对象?
、
、
我有一个DataFrame,我想从其中随机选择20%
的
数据
作为测试
数据
。但是,我需要从我
的
原始
集中
删除上述
数据
作为培训
数据
。我有一个由
随机样本
组成
的
索引列表(原始DF
的
索引)。当我使用for循环和函数.pop()时,索引会发生变化,因此在第一次迭代之后,元素就会被移除,而不是我
的
测试
数据
框架中
的
元素。我需要帮助
从
第一个
数据
<em
浏览 2
提问于2021-08-28
得票数 0
回答已采纳
2
回答
用概率分布填充缺值
、
、
我想在我
的
数据
中填充丢失
的
值。这些都是很好
的
选择,但我想从
数据
分布中随机抽取一个样本。例如,在所提供
的
数据
中,将根据以下概率填充空: P(2) = .2 P(4) = .1
从
随机样本
中填充这些值
的
最佳方法是什么?
浏览 0
提问于2017-10-08
得票数 1
回答已采纳
1
回答
Keras flow_from_directory会遍历目录中
的
每个样本吗?
、
、
在Keras预处理迭代器模块中,flow_from_directory方法用于
从
包含图像
的
子目录
的
目录创建ImageDataGenerator。迭代器无限运行,创建多批图像。我
的
问题是,它是否遍历每个时期
的
每个样本? 例如,如果我总共有300张图片,批处理大小是30,如果我做了10个步骤,它会遍历每个样本一次吗?或者每个步骤都是整个
数据
集中
的
独立
随机样本
?在步骤11,迭代器是否知道首先
获取
最后4个样本,然后
从
浏览 8
提问于2018-03-01
得票数 0
1
回答
在SAS中,是否可以对另一个
数据
集中
的
地层进行分层随机抽样?
、
我正在尝试比较属性分层不同
的
两个
数据
集。是否可以在一个
数据
集中
进行分层随机采样,但使用另一个
数据
集
的
分层?为了说明这一点,我举了一个例子:现在我有了另一个
数据
集,
数据
集B,它包含100k条记录,具有相同
的
属性和颜色,但具有20%
的
蓝色和80%
的
红
浏览 24
提问于2020-05-28
得票数 0
回答已采纳
1
回答
R:海量
数据
的
简单
随机样本
、
我有一个庞大
的
(8GB)
数据
集,我无法使用我现有的设置读取到R。试图在dataset上使用fread会立即使R会话崩溃,并且试图
从
底层文件中随机读取行是不够
的
,因为:(1)我无法很好地了解
数据
集中
的
总行数;(2)我
的
方法不是真正
的
“随机抽样”。这些
获取
行数
的
尝试都失败了(只要简单地读取
数据
就可以了): length(count.fields("file.dat&quo
浏览 6
提问于2017-12-08
得票数 3
回答已采纳
2
回答
从
数据
帧
中选择随机数
、
、
、
我已经按照Bernaard &Sijtsma (2000)
的
用于缺失
数据
补偿
的
双向方法概述
的
步骤创建了一个“错误”
的
数据
帧
。为了完成对缺失
数据
的
计算,我需要从这个错误
数据
框中随机选择一个数字,并将其添加到我已经计算出
的
缺失
数据
值中。 我熟悉sample()函数,但我不是在寻找行或列
的
随机样本
,而是
从
数据
浏览 2
提问于2014-05-15
得票数 0
1
回答
sas测量柱上
的
挠曲选择
我试图创建一个基于2列
的
带有proc surveyselect
的
唯一样本
数据
集。我有一张带有person_id和household_id
的
简单桌子。在本例中,person_id是我
的
“主键”,它是创建示例
的
主要输入。但是,我需要确保不要在样本
数据
和基本
数据
之间混合household_id。因此,如果household_id = 123是示例,则不允许它出现在基本
数据
中(即使使用另一个person_id),反之亦然。 你有个方便
浏览 2
提问于2017-03-28
得票数 0
回答已采纳
2
回答
空间点
数据
帧
中随机点
的
子集
、
、
、
我需要从我在ArcGIS中创建
的
网格中选择R中
的
随机点。我是个新手,所以我对代码不太熟悉。我有一个包含160831个元素(点)
的
大型SpatialPointsDataFrame,名为"gridpts“。我用"readOGR“导入了这些点[1] "gpts" "L_code" "Lake" "Area" 我想通过"L_code“来设置这些点
的
子集,然后选择随机
浏览 7
提问于2020-05-19
得票数 0
1
回答
如何在Tensorflow 2中有效地进行
数据
增强?
、
当我听说
数据
增强时,我学到
的
定义是:“这是一种将当前
数据
集
的
一些样本(如旋转、翻转、亮度等)转换为
数据
集
的
技术。” 但在该教程中,他们只是用转换后
的
样本覆盖当前
数据
集,而不是添加新
数据
.还是我错了?这样做
的
正确方法不是
获取
N个
随机样本
,转换它们并将它们添加到
数据
集中
?
浏览 0
提问于2022-07-18
得票数 1
回答已采纳
1
回答
我是否需要为推荐系统读取整个
数据
库?
、
、
、
假设我有一个大约100000行
的
数据
库。我想建立一个基于内容
的
推荐系统。我真的需要读取整个
数据
库来计算相似度吗?这将是非常昂贵
的
做它托管在AWS,Azure等。此外,我
的
数据
总是在变化(新
的
数据
被添加,旧
的
删除),所以我不能只是使用一个常量文件。有什么更符合成本效益
的
方法吗?
浏览 0
提问于2021-07-24
得票数 0
1
回答
使用for循环来子集
数据
并创建变量
、
目标 我有美国每个州
的
个人调查
数据
集。我想将它们合并到一个美国
的
数据
集中
,但是每个
数据
集
的
变量不相等。因此,我计划为每个状态创建
子
设置
的
<em
浏览 0
提问于2016-08-11
得票数 0
回答已采纳
1
回答
从
数据
流中
获取
随机样本
数据
、
从
数据
流中
获取
随机样本
数据
是可能
的
吗?
浏览 1
提问于2021-10-13
得票数 0
回答已采纳
3
回答
从
其他
数据
帧
获取
数据
帧
、
,这是我
的
dataframe 0 Sep-2015 Adam 32 Sep2015 Adam 35 Sep-2015 Hardik 1现在我想要唯一
的
Name关于Date,并输入
其他
dataframe。Adam Hardik David Sep-2015 3
浏览 2
提问于2021-09-17
得票数 1
4
回答
使用嵌套条件提取data.frame中行
的
随机样本
、
这个问题是
从
SO post 构建
的
,并使用了
从
R-help邮件列表中修改
的
代码,该列表可以是> head(iris)13.6 1.4 0.2 setosa 6
浏览 2
提问于2013-11-14
得票数 13
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
谷歌详细介绍MediaPipe对象检测与追踪系统
大唐杯辅导直播-串讲重点
pandas系列学习(五):数据连接
如何构建自定义人脸识别数据集
考一考!Linux C语言思考题4道
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券