腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
h2o
AutoML
上
检索
保持
数据
集
的
交叉
验证
性能
(
AUC
)
python
、
machine-learning
、
cross-validation
、
h2o
、
automl
我正在使用默认
的
交叉
验证
(nfolds=5)通过
h2o
AutoML
训练一个二进制分类模型。我需要获得每个坚持折叠
的
AUC
得分,以便计算可变性。这是我使用
的
代码: h2o.init() prostate = h2o.import_file("https://h2o-public-test-data.s3.amazonaws.com/smalldatapredictors, response_col, train
浏览 13
提问于2020-09-24
得票数 3
回答已采纳
1
回答
H2O
Python:提取具有最高
验证
数据
集
的
网格搜索模型
python
、
h2o
我正在使用
H2O
Python使用网格搜索构建一个随机森林模型。我
在
训练和
验证
中对
数据
进行分割,并使用k折叠
交叉
验证
来选择网格搜索中
的
最佳模型。我能够用训练
集
上
最好
的
MSE
检索
模型,但我想
检索
验证
集
上
具有最高
AUC
的
模型。 我可以用Python编写所有代码,但我想知道是否有一种
H2O<
浏览 2
提问于2016-10-23
得票数 2
回答已采纳
1
回答
h2o.
auc
( perf,xval =TRUE) -这个调用返回什么?
h2o
我
的
代码如下perf <- h2o.performance(gbm.fit.hex , tr.hex) a = h2o.
auc
(perf , xval = TRUE)
auc
呼叫返回
的
是什么?它是
在</em
浏览 0
提问于2015-09-05
得票数 0
回答已采纳
1
回答
H2o
交叉
验证
不对应于单列/测试
python
、
machine-learning
、
random-forest
、
h2o
我试图了解
在
H2o
中
交叉
验证
是如何工作
的
,当指定了传递'fold_column‘参数
的
折叠时。图书馆说: fold_column选项指定
数据
集中
的
列,该列包含每个观察
的
交叉
验证
折叠索引分配。我假设在每次
交叉
验证
迭代中,使用带有fold_column =i
的
行作为测试
集
,其余
的
行用作列车
集</
浏览 2
提问于2020-07-28
得票数 1
1
回答
保留h2o.
automl
的
交叉
验证
预测和折叠分配
r
、
cross-validation
、
h2o
我看不到设置参数
的
选项和用于
h2o
R包中
的
h2o.
automl
是否有其他方法可以访问h2o.
automl
()调用中使用
的
交叉
验证
数据
集
? 之所以需要这样做,是因为模型中使用
的
响应变量是对数转换
的
,并且计算
的
交
浏览 4
提问于2018-01-18
得票数 4
回答已采纳
1
回答
是否可以使用经过
验证
的
模型对整个
数据
集
进行预测?
r
、
validation
、
machine-learning
、
cross-validation
、
gbm
我们已经
在
大约15k行
的
数据
集
上
运行了'gbm‘模型。我们已经直接实现了10折
交叉
验证
,以提出一个
交叉
验证
模型,我们正在使用该模型
在
同一
数据
集
上
再次进行预测。这导致了可能过拟合
的
模型约为0.99训练
AUC
和0.92cv
AUC
。预测
AUC
也很高,约为0.99。 审查者要求我们使用坚持
浏览 1
提问于2018-04-18
得票数 2
1
回答
在
logistic回归中重复计算
AUC
是否有意义?
logistic-regression
、
auc
、
roc
、
validation
我有一个关于logistic回归模型和测试它
的
技巧
的
问题。我不太清楚我是否正确理解中华民国曲线是如何建立起来
的
。如果是第一种情况,是否有必要重复进行随机列车试验,并将曲线下
的
面积平均化?这会给模特
的
技能带来更多的确定性吗? 谢谢。
浏览 0
提问于2021-05-26
得票数 0
2
回答
不平衡分类问题
的
k-折叠CV估计测试
AUC
machine-learning
、
classification
、
r
、
cross-validation
、
class-imbalance
我有一个不平衡
的
分类问题。然后,我使用R包ROSE同时对Dataset A中
的
多数类进行了欠采样,并对少数类进行了过采样。这产生了一个平衡
集
(Dataset C),其行数与Dataset A一样多。 我已经在
数据
集
C和计算训练
AUC
上
训练了我
的
模型。现在我想使用k倍<
浏览 0
提问于2018-04-04
得票数 1
1
回答
R H20 -分层抽样和非I.D.
交叉
验证
。行
r
、
cross-validation
、
h2o
我正在使用
H2O
来分析
数据
集
,但我不知道如何正确地对
数据
集
执行
交叉
验证
。我有一个不平衡
的
数据
集
,所以我希望执行分层
交叉
验证
(如果输出变量用于平衡每个分区
上
的
组)。然而,最重要
的
是,我还有一个问题,就是我
的
许多行都是重复
的
(一种实现权重而不实际拥有权重
的
方法)。除了这个问题<e
浏览 2
提问于2019-01-02
得票数 0
回答已采纳
1
回答
R glm -如何进行多重
交叉
验证
r
、
cross-validation
我有训练
数据
,我随机分成两部分: 第
浏览 5
提问于2014-05-14
得票数 3
回答已采纳
1
回答
从网格搜索中获取模型
的
cross_validation_holdout_predictions()
h2o
我正试图用一种不同
的
方式来计算
性能
,它现在是如何为模型内置
的
。 rrc[m.model_id] = m.cross_validation_holdout_predictions() 我可以用
数据
集
上
的
模型运行预测,但我认为这个测试可能会有偏差,因为模型以
浏览 2
提问于2017-09-16
得票数 2
回答已采纳
1
回答
h2o
自动机
auc
系数低
python
、
h2o
我正在对具有3000个观察值(用于二进制分类)
的
数据
运行
H2O
AutoML
,默认值为10%。最佳模型
的
AUC
非常低(
在
测试
数据
上
为0.6)。我怎样才能最大化它?
浏览 1
提问于2019-07-25
得票数 0
1
回答
从
h2o
中,是否有一种方法可以将N个文件夹
交叉
验证
结果导出到
数据
文件中?
python
、
h2o
、
sparkling-water
我正在用
H2O
火花水建立GBM模型。我知道我们可以使用下面的代码查看N个文件夹
的
交叉
验证
结果:但是,是否有一种方法可以将每个文件夹
的
模型
性能
保存到
数据
帧中例如,将每个文件夹
的
AUC
保存到
数据
框架中。
浏览 6
提问于2018-11-01
得票数 0
回答已采纳
1
回答
h2o
交叉
验证
预测中
AUC
值
的
解释总结
r
、
cross-validation
、
h2o
、
glm
、
auc
我注意到,
在
一些运行中: train=as.h2o(u) training_framecv迭代,
在
AUC
的
交叉
验证
度量摘要中存在NaNs。例如: print(mod@model$cross_validation_metrics_summary["
auc
",])
交叉
<e
浏览 89
提问于2019-02-15
得票数 0
回答已采纳
1
回答
天蓝色ML中
的
K-折叠
交叉
验证
azure
、
azure-machine-learning-studio
、
automl
、
azure-auto-ml
目前,我正在使用使用sdk构建
的
azure管道来训练模型。我正试图
在
我
的
ml步骤中添加
交叉
验证
。我注意到,您可以
在
配置
autoML
时将其添加到参数中。我
的
数据
集
由30%标签0和70%标签1组成。我
的
问题是,
在
执行
交叉
验证
时,azure
autoML
是否分层
数据
?如果不是,
在
将其传递给
a
浏览 3
提问于2022-09-15
得票数 0
1
回答
XGBOOST missing_value特性降低了我
的
性能
?
xgboost
、
missing-data
、
auc
我正在训练一个痛风病
的
xgboost模型,
在
我抽样
的
1:7病例控制比率
的
训练
集
上
(
在
病例中丰富)。我有220个特性,我达到一个
交叉
验证
的
0.90
的
AUC
。对于缺少
的
值,我使用了一个特殊
的
值-65336,我不告诉XGBOOST --我让它处理缺失
的
值,就像对待其他值一样。 然后,我
在
一般人群中使用它,实际比率约为
浏览 0
提问于2017-08-06
得票数 1
1
回答
排行榜
性能
中
的
automl
NaN
h2o
我正在使用H2O.AI h2o.
automl
函数来执行一个标准
的
二进制分类问题。我使用
的
是CRAN
上
发布
的
最新包版本。我运行了以下代码:
浏览 0
提问于2017-10-12
得票数 0
1
回答
尽管
交叉
验证
结果非常成功,但对随机森林
的
过度拟合
python-2.7
、
random-forest
、
h2o
我在
数据
科学方面有一定
的
经验。我有9500个观测
数据
集
和4500多个特征,其中大部分是高度相关
的
。下面简要介绍一下我尝试过
的
内容:我删除了少于6000个非NAs
的
列,并在至少有6000个非NAs
的
情况下计算了NAs及其相应列
的
中值。至于相关性,我只保留了最多与他人有0.7相关
的
特性。通过这样做,我将功能
的
数量减少到了750个左右。然后,我
在
随机森林
的
二进制分类任务
浏览 2
提问于2017-11-13
得票数 1
回答已采纳
1
回答
h2o
随机林
的
置信区间
r
、
random-forest
、
h2o
我注意到,有几个函数设计用于计算使用randomForest包构建
的
模型
的
置信区间,例如rfPredVar in RFinfer。我想知道是否有人知道像rfPredVar这样
的
函数可以计算使用
h2o
包构建
的
RF模型
的
置信区间。在此之前,非常感谢您。
浏览 1
提问于2017-11-01
得票数 2
1
回答
在
循环中运行
H2O
的
Auto ML
r
、
loops
、
machine-learning
、
data-science
、
h2o
我试图
在
for循环中运行
H2O
的
AutoML
,但在每次迭代后保存结果都有问题。 我
的
计划是为我
的
数据
集中
的
每个组运行
AutoML
,并保存每个组
的
排行榜。我已经按组创建了子集
数据
集
,所以基本
上
我想要做
的
是循环遍历
h2o
帧
的
列表,并为每个
数据
集
构建自动机。= c("df
浏览 1
提问于2018-04-24
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
AutoML取人代之?四个工程师两个数据集将之干翻!
AutoML取人代之?四个工程师两个数据集将之干翻
三行代码,AutoML性能提高十倍!微软开源FLAMA,比sota还要sota
【AI读论文】CAAFE:基于大模型的自动特征工程
机器学习概述与算法介绍(二)
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券