腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
编写
按
地层
大小
对
样本
进行
分层
的
函数
r
、
function
我有100个
样本
。我想写一个
函数
来
对
它们
进行
分层
。 stratify <- function(s,size) 例如:层数s=2,
大小
= (20,80),层数= 1,2。层数s=4,size=(25,25,25,25),层数= 1,2,3,4 ...And更多地依赖于传递给
函数
的
内容。 打印
的
期望结果应该是一个具有标识符编号(1到100)和相应层号
的
矩阵。20,80),我知道我可以这样做 ResultMatrix
浏览 18
提问于2020-11-11
得票数 0
回答已采纳
1
回答
如何
在不平衡数据上设置随机森林
的
采样
大小
r
、
random-forest
我想用随机森林建立一个物种分布模型:model <- randomForest(presence ~ v1 + v2 + v3, data = train) 因为我
的
数据是不平衡
的
(71/900),所以我尝试在随机森林模型中包含sampsize
浏览 5
提问于2018-01-07
得票数 1
回答已采纳
1
回答
R中随机林
分层
抽样
r
我在randomForest
的
文档中阅读了以下内容
样本
大小
:要绘制
的
样本
的
大小
。在分类上,如果
样本
大小
是
地层
长度
的
向量,则取样
按
地层
分层
,
样本
元素表示从
地层
中提取
的
数字。为供参考,该
函数</e
浏览 5
提问于2013-02-12
得票数 8
回答已采纳
2
回答
BigQuery
分层
随机抽样?
sql
、
google-bigquery
如何
在BigQuery上
进行
分层
采样? 例如,我们想要一个10%
的
比例
分层
样本
,使用category_id作为
地层
。我们
的
一些表中有高达11000个category_ids。
浏览 0
提问于2018-10-20
得票数 13
回答已采纳
1
回答
R中
的
分层
随机抽样
r
我正在努力创建一个
大小
为100
的
分层
样本
,使用
分层
随机抽样和3078个观测数据。
分层
随机抽样必须满足
的
条件是: FARMS92<100,100 ~ 300,300 ~ 600,FARMS92>600为
地层
,采用比例分配。当我遵循
分层
函数
:时,我不知道
如何
继续 COUNTY STATE ACRES92 ACRES87 FARMS92
浏览 3
提问于2017-05-01
得票数 3
回答已采纳
1
回答
使用R中
的
采样程序包从
地层
中采样0个观测值
r
、
sampling
、
stratum
我在不同
的
数据子集上使用相同
的
脚本。遇到一个数据子集,其中来自测试组
的
观测值为0,因此需要从控制组中选择0个观测值。 是否有一些语法或我遗漏了什么来选择0个观察值?
浏览 3
提问于2018-08-22
得票数 0
1
回答
实现半控制随机集
的
最好
的
SAS方案是什么?
random
、
sas
我所使用
的
场景是创建一个宏,该宏接收数据集并生成随机
分层
样本
,
分层
应该是由列状态
进行
的
,在创建随机
样本
时,该列状态还需要相等
的
表示总数(如果可能)。所需
样本
的
大小
有一些我们必须遵守
的
规则,这些规则是: 如果总数据集
大小
为<= 50,则让
样本
大小
=整个数据集,如果总数据集
大小
介于51到500之间,则让<em
浏览 0
提问于2021-07-08
得票数 1
回答已采纳
1
回答
蟒蛇
的
分层
取样
python
、
sample
此
样本
必须按特定变量
分层
。我尝试了sklearn.cross_validation,但问题是你只能用一个变量
分层
,我需要根据几个变量来区分我的人口。所以我要找
的
是proc调查,(SAS中
的
地层
指导)或者svydesign(R中)。这个
函数
是否存在于python中?我在这个页面上发现了
函数
stratified_samples ,但是没有文档或使用示例,很难理解
如何
输入
分层
变量。 谢谢你
的
帮忙
浏览 7
提问于2016-07-21
得票数 2
1
回答
基于单独电子表格(.csv)中值
的
子集shapefile多边形
r
、
subset
、
shapefile
但是,如果某些
地层
并不总是被采样(
样本
大小
为0),而用于空间抽样
的
GRTS
函数
(spsurvey)不允许任何努力,那么那些没有努力
的
地层
就会被移除;留给我
的
是一个.csv文件,该文件只包含采样努力大于0
的
地层
。从这个
地层
子集,我需要同步到包含
样本
将被分配给
的
地层
多边形
的
shapefile (即,不被采样
的
<em
浏览 1
提问于2014-05-29
得票数 0
回答已采纳
2
回答
计算人口均值协方差
的
NumPy矢量化方法(用于调查数据)
python
、
algorithm
、
performance
、
numpy
、
vectorization
我将从一个关于调查数据
的
介绍开始。你可以跳过它调查数据是由调查专家提出
的
一种复杂
的
抽样模式形成
的
。
样本
可以
按
国家、地区或县、地区、地点等
进行
分层
,甚至可以
按
种族、收入等
进行
分层
。一旦建立了解决调查设计问题
的
地层
,就会从这些
地层
中随机抽取
样本
。
对
这些
样本
进行
了调查,但由
浏览 1
提问于2015-12-12
得票数 2
回答已采纳
1
回答
R中给定数目/比例
的
每组
样本
的
有效方法
r
、
random
、
group-by
我想知道是否有一种有效
的
抽样方法,为群体选择一个整数和/或比例
样本
。我知道sample_n
的
存在,它适用于分组dfs,但据我所知,它为每个组采样相同
的
编号。对于这个问题
的
最小描述,在一个简单
的
情况下,将是从dataframe mpg中为cyl == 4
的
5行随机行(或这些行
的
索引向量)、cyl == 6
的
7行和cyl == 8
的
3行
进行
抽样。
浏览 4
提问于2020-12-02
得票数 0
回答已采纳
1
回答
Ggg林错误-所选未定义列
r
、
survival
我正试图用ggforest()为我
的
模型绘制一个forrest图。下面是创建模拟数据以再现问题
的
代码。根据对数据
进行
时间相关协变量
的
格式化。我想这可能是ggforest不能正常工作
的
原因。我试着安装以前版本
的
软件包扫帚(0.5.6版),就像以前
的
线程中建议
的
那样,但是它没有解决这个问题。R版本3.6.1和4.1.1。有什么想法吗?移除+
地层
()会产生一个地块。
浏览 2
提问于2021-10-13
得票数 0
1
回答
PySpark比例
分层
抽样"sampleBy“
pyspark
、
sampling
问题:如果您使用PySpark
的
sampleBy实现比例
分层
抽样,这不是与随机抽样相同吗?A: 25%,B: 50%,C: 13%,D: 12% 然后,选择
大小
为100
的
比例
分层
样本
意味着选择一个
样本
,该
样本
由A中的确切25种元素、B中
的
50种元素、C中
的
13种元素和
浏览 7
提问于2021-10-08
得票数 1
回答已采纳
2
回答
带约束
的
分层
抽样
r
、
splitstackshape
我是R区
的
新手,所以请耐心点。据我理解,这个
函数
首先生成一个10%
大小
的
层,并从中选择那些在8到10之间满足条件B=30和c
的
记录。
浏览 1
提问于2017-09-07
得票数 0
回答已采纳
1
回答
有没有办法通过连续变量
对
R中
的
表1
进行
分层
r
我正在分析R中
的
一个大型数据集,在创建我
的
TableOne时,我希望通过变量
的
存在来
对
整个
样本
进行
分层
。我正在与接受肺动脉高压测量(连续变量)
的
患者一起工作,但在我
的
表格中,我只想比较有测量
的
患者和没有测量
的
患者。 任何帮助都是非常感谢
的
。我知道我必须指定
地层
,但我不知道
如何
在存在连续度量与那些没有度量
的
情况下这样做(AKA。它
浏览 19
提问于2020-01-10
得票数 0
1
回答
proc测量选择alloc选项错误地读取我
的
分配数据集?
sas
、
sampling
好
的
,所以我有一个数据集,我必须根据另一个数据集
的
比例
进行
抽样,而且我已经有一个包含2列
的
分配数据集:
分层
和alloc。我检查了我
的
分配数据集,我发现该层等于1。我不确定我
的
数据集或代码是否有问题。我已经
按
地层
对
have数据集
进行
了排序,也
按
分层
对分配数据集
进行
了排序。我一直在使用相同
的
(或类似的)脚本从下面的许多不同
的
浏览 3
提问于2020-07-02
得票数 0
回答已采纳
1
回答
R中>25层
的
分层
自举
r
、
random
、
group-by
、
statistics-bootstrap
、
sample-size
我有大约25个不同组
的
数据。为了了解如果我有不同
的
样本
大小
,每组
的
方差将
如何
变化,我尝试
进行
分层
引导。例如,在
样本
大小
为5
的
情况下,它应该为每组产生5个重采样点
的
1000个集合。我喜欢收集最小
的
样本
量,如有必要,每组5到30个。 我遇到
的
问题是,我必须
对
每个组设置子集,并在单个组上运行引导程序,然后将R输出复制
浏览 15
提问于2017-06-16
得票数 3
回答已采纳
2
回答
半球
分层
余弦加权
样本
的
生成
raytracing
、
global-illumination
、
monte-carlo
、
importance-sampling
我
对
余弦加权半球
样本
很幸运,我知道
如何
生成
分层
均匀
样本
,但我想将两者结合起来
进行
实验。然而,在执行余弦加权抽样时,我
如何
正确地
分层
半球呢?我对
分层
进行
余弦加权吗?我在每个阶层投了多少射线?我
的
应用程序是在光映射器中收集间接
样本
。
浏览 0
提问于2017-02-09
得票数 3
回答已采纳
1
回答
如何
通过proc测量选择从数据集中循环单个观测?
loops
、
sas
、
sas-macro
、
do-loops
我希望通过proc测量选择
函数
从该数据集中运行每个ID。我希望第一个ID在
函数
中运行,然后循环到第二个ID来运行该
函数
。输出每个ID
的
数据集。
如何
执行?如果可能的话。
浏览 7
提问于2022-05-31
得票数 0
回答已采纳
2
回答
如何
使用R对重复
的
数字序列
进行
分组
r
完整
的
背景是;我正在使用R spcosa包在地块上
进行
等面积
分层
复合采样。我从一个包含许多多边形(地块)
的
GIS中
的
形状文件开始。我想要
的
最终结果是一个GIS文件,每个图层和
样本
位置都以GIS文件格式存在,每个图层和
样本
位置都由地块、
地层
和
样本
id标记。到目前为止,除了识别
样本
所属
的
地层
并将其包含在
样本
标签中之外,我可以完成所有这些工作。示例标签
浏览 0
提问于2016-07-01
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python机器学习库的介绍1:数据切分器
机器学习入门——基本概念(2)
山区隧道地质快速建模
模型选择与评价(一)
机器学习实战之KNN算法
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券