腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1695)
视频
沙龙
1
回答
GBM
模型
:
为什么
在
h2o
R
中
网格
搜索
的
验证
精度
会
波动
、
我
在
R
中使用了
H2O
包,并试图通过
gbm
模型
来提高我
的
分数。我尝试使用训练集和有效集进行
网格
搜索
。但是当它完成时,两组之间
的
对数损失曲线是非常不同
的
。事实上,我
的
训练集存在过拟合,因此
精度
高于我
的
有效集ntrees = 100, max_dept
浏览 7
提问于2018-08-24
得票数 0
1
回答
每次迭代
R
访问处理时间中
的
h2o.grid
、
、
是否有任何方法提取
网格
搜索
每次迭代所需
的
时间/内存?我希望绘制一个结果度量(例如,AUC)和处理需求,以检查在我
的
模型
中
增加复杂性
的
成本效益。
浏览 1
提问于2017-09-08
得票数 1
回答已采纳
3
回答
H2O
R
api:从
网格
搜索
中
检索最优
模型
、
、
我
在
R
中使用
h2o
包(v3.6.0),并构建了一个
网格
搜索
模型
。现在,我正在尝试访问
在
验证
集上最小化MSE
的
模型
。
在
python
的
sklearn
中
,使用RandomizedSearchCV很容易实现这一点grid = RandomizedSearchCV(model, params, n_iter = 5) grid.fit(X)
浏览 8
提问于2016-02-26
得票数 8
回答已采纳
1
回答
交叉
验证
指标
中
的
默认阈值-
h2o
R
包
、
、
、
我使用
R
中
的
h2o
包创建了
GBM
的
笛卡尔
网格
,并将每个
模型
的
交叉
验证
指标保存在数据帧
中
。因此,对于每个
模型
,我将结果存储
在
model@model$cross_validation_metrics_summary
中
。
在
model@model$cross_validation_metrics_summary
中
,用于
浏览 9
提问于2019-09-18
得票数 0
回答已采纳
1
回答
h2o
GBM
:叶预测
、
、
我
在
h2o
中
对
GBM
执行
网格
搜索
,以获得具有连续预测器
的
连续结果。我使用交叉
验证
进行训练,然后
在
测试集上进行预测。我使用
的
是函数.predict_leaf_node_assignment: best_
gbm
.predict_leaf_node_assignment(test_frame_h2o) ( best_
gbm
是我从
网格
搜索
中</e
浏览 0
提问于2018-02-06
得票数 1
回答已采纳
1
回答
在
h2o
中分配案例权重以
在
开发数据上构建
gbm
create overfit?
、
、
我正在使用
h2o
构建
gbm
模型
。训练数据随机分为70%
的
开发数据和30%
的
及时
验证
数据。训练数据有1.4%
的
坏率,我还需要为每个观察值分配权重(数据有一个权重栏)。观察结果是:与无权重构建
的
模型
(VAL)相比,有权重构建
的
模型
在
开发数据(DEV)上
的
性能要高得多。使用权重构建
的
模型
在
开发数据和实时
验证<
浏览 1
提问于2017-05-08
得票数 2
1
回答
H2O
中
的
自定义损失函数
、
、
我正在通过
R
使用
H2O
,我试图建立随机森林,XGBoost,
GBM
模型
来解决多类问题。
H2O
提供
的
模型
性能洞察力很好,但作为成功
的
标准之一,我有自己
的
自定义函数,当
模型
用于对一组用户进行评分时,该函数可以对
模型
精度
进行评分。一般来说,这个函数奖励预测,惩罚错误预测。鉴于此问题中
的
目标类是序数类别,惩罚分数取决于未命中预测
的
位置数。该自定义函数<e
浏览 0
提问于2018-09-08
得票数 5
1
回答
为什么
h2o.saveModel挂在
R
v3.3.2和
H2O
v3.10.4.2
中
?
、
、
2017年6月23日:又一次更新.我在下面添加了一个更新.$ uname -a我现在正在
R
和<em
浏览 3
提问于2017-04-02
得票数 1
1
回答
是否可以将加载
的
h2o
网格
用于堆叠组件?
、
、
我目前正在使用
R
和
h2o
库
的
不同机器学习方法处理多个数据集。因为我对每个数据集有几个10倍
的
交叉
验证
,所以我为每个数据集运行了一个随机
的
GridSearch,并使用h2o.saveGrid保存了
网格
。但是,keep_cross_validation_predictions被设置为true,如果我使用
网格
而不保存和加载它,它就运行得非常好。所以我猜沿着装载和保存
的
路线
会
丢失一些东西。有没有人知道
在
<e
浏览 0
提问于2020-11-24
得票数 1
回答已采纳
1
回答
在
foreach循环中运行
h2o
算法?
、
、
、
、
我天真地认为,
在
foreach循环中并行地对h2o.
gbm
进行多个调用是直接
的
。但出了个奇怪
的
错误。cl = makeCluster(6, type="SOCK")junk <- foreach(i=1:6, f
浏览 6
提问于2016-09-16
得票数 3
回答已采纳
1
回答
H2O
Python:提取具有最高
验证
数据集
的
网格
搜索
模型
、
我正在使用
H2O
Python使用
网格
搜索
构建一个随机森林
模型
。我
在
训练和
验证
中
对数据进行分割,并使用k折叠交叉
验证
来选择
网格
搜索
中
的
最佳
模型
。我能够用训练集上最好
的
MSE检索
模型
,但我想检索
验证
集上具有最高AUC
的
模型
。 我可以用Python编写所有代码,但我想知道是否有一
浏览 2
提问于2016-10-23
得票数 2
回答已采纳
3
回答
H2O
“
网格
:
在
foreach循环中并行执行autoML时,不能向具有不同训练输入
的
网格
中
添加新
模型
、
、
我试图使用autoML提供
的
H2O
特性来并行化多个ML
模型
的
培训。h2o.saveModel(leader, ...所有
模型
中
只有一部分被训练并保存在它们
的
文件夹
中
,因为
在
某个时候我得到了以下错误: water.exceptions.H2OIllegalArgumentEx
浏览 0
提问于2019-04-25
得票数 1
回答已采纳
1
回答
获取用于具有早期停止
的
GBM
的
树数
、
、
我
在
h2o
中使用早期停止和设置ntrees=10000来训练
GBM
。我想取回
模型
中
的
树
的
数量。但是如果我调用model.params['ntrees'] ( model是
网格
搜索
中最好
的
模型
),我就会得到其中,10000是我
在
培训期间设置
的</em
浏览 1
提问于2018-04-25
得票数 1
回答已采纳
1
回答
h2o.ensemble和h2o.stack
在
封装h2oEnsemble中有什么不同?
、
根据对功能
的
描述: h2o.stack:这个函数使用用户指定
的
现有
H2O
基本
模型
列表创建一个“超级学习者”(叠加)集成。h2o.ensemble:这个函数使用用户指定
的
H2O
基础学习算法创建一个“超级学习者”(叠加)集成。
浏览 4
提问于2017-02-23
得票数 6
回答已采纳
1
回答
H2O
:无法通过`h2o.loadModel`从磁盘读取大
模型
、
、
我无法加载我以本机
H2O
格式(即十六进制)保存
的
大型
GBM
模型
。
H2O
v3.10.5.1 我
的
目标是最终将这个
模型
保存为MOJO。这个
模型
太大了,我不得不用最小/最大内存100 G/200 g初始化
H2O
,然后
H2O
的
模型
训
浏览 1
提问于2017-06-24
得票数 0
回答已采纳
2
回答
使用
H2O
GBM
模型
的
MOJO文件再现预测
、
、
、
、
我用
H2O
版本3.26.0.5来训练一个二进制问题
的
GBM
模型
,来预测正类
的
概率。我将
模型
文件保存为MOJO,并使用该文件
在
新数据中生成预测:library(
h2o
) predic
浏览 4
提问于2019-11-22
得票数 0
回答已采纳
1
回答
一种
在
GridSearch
中
删除交叉
验证
模型
的
方法?
我一直没有记忆建立随机森林
模型
在
H2O
木星笔记本。我发现,使用我
的
20 GB内存实例,我可以
在
抛出“树
模型
将不适合驱动节点
的
内存”异常之前,构建大约两个具有10倍交叉
验证
(总共22个
模型
)
的
50树
模型
。使用for循环,
在
计算和显示度量之后,我可以删除交叉
验证
模型
,但是使用GridSearch,似乎没有任何方法
在
搜索</e
浏览 2
提问于2018-07-18
得票数 1
回答已采纳
4
回答
从
H2O
模型
对象获取
模型
详细信息
、
我有一个相当简单
的
问题,但在任何地方都无法找到有记录
的
解决方案。model = H2ODeepLearningEstimator(...)完成此操作后,我希望从model对象中提取
模型
的
类型。也就是说,我
在<
浏览 5
提问于2017-08-11
得票数 6
回答已采纳
1
回答
对于使用Python
中
的
H2O
进行
网格
搜索
,我们应该在哪里设置种子?
、
我看到在
网格
搜索
优化超参数时,有几个地方可以设置种子,例如,我们可以
在
以下三个位置设置种子 谢谢!
浏览 0
提问于2018-09-20
得票数 0
回答已采纳
2
回答
使用不同输入
的
模型
叠加
H2O
集成
、
、
使用
h2o
flow,是否有一种方法可以创建一个基于单个
模型
的
堆叠集成
模型
,这些
模型
可能不接受相同
的
输入,但可以
在
相同
的
响应标签上进行预测。model1(diagnosis1, diagnosis2, ..., diagnosis5) -> denied or paid (by insurer) mode
浏览 4
提问于2017-11-09
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券