腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(699)
视频
沙龙
1
回答
在
python
sklearn
中
加载
和
使用
XGBoost
PMML
或
XGBoost
.
rds
模型
,
而
不会
丢失
其
依赖
关系
/
性质
、
、
、
、
我有一个用R构建的XGB
模型
,我想在
python
中
使用
相同的
模型
进行预测,
而
不会
丢失
其本质/嵌入的
依赖
关系
。我试过rpy2
和
sklearn
-
pmml
-model,似乎对
XGBoost
模型
没有帮助。 感谢任何帮助。
浏览 25
提问于2019-10-18
得票数 0
5
回答
如何保存和
加载
xgboost
模型
?
、
、
、
来自 bst =xgb.Booster({‘n线程’:4}) # init
模型
bst.load_model('model.binsave_model
和
dump_model有什么区别? 保存'0001.model'
和
'dump.raw.txt','featmap.txt'有什么区别?为什
浏览 50
提问于2017-04-29
得票数 84
1
回答
如何在空隙计算机上
使用
XGBoost
在
SciKit中学习?
、
、
我想在科学学习中
使用
XGBoost
,但是,我
在
一台空隙计算机上,无法正常
使用
pip安装它。 如何在空隙计算机上安装
XGBoost
?
浏览 0
提问于2023-01-06
得票数 0
回答已采纳
2
回答
一种具有近机会最优性能问题的机器学习算法
、
、
我刚开始机器学习,所以我将用两个例子来总结我的问题,
而
不需要技术(因为我不能)。对于我的问题,没有确定性,只有一个略好于随机预测。我正试图预测最近从监禁
中
释放出来的人是否会在明年内犯罪。我知道这个任务是可能的,因为我
使用
了一个数据集(大约有50个特性
和
10万个观察)来建立一个“人工”线性回归,从样本
中
获得了大约52%的结果。我尝试过<
浏览 0
提问于2020-06-25
得票数 2
2
回答
如何
使用
自定义转换器保存滑雪板管道?
、
、
、
、
我试图用mlflow保存一个
sklearn
机器学习
模型
,它是一个包含我定义的自定义转换器的管道,并将它
加载
到另一个项目中。', serialization_format=mlflow.
sklearn
.SERIALIZATION_FORMAT_CLOUDPICKLE) 但我
在
加载
过程
中
也会出现同样的错误。我认为mlflow提供了一种简单的方法来保存
模型
并序列化它们,这样它们就可以在任何地方
使用
,如果您有本地
sklear
浏览 17
提问于2020-03-04
得票数 8
4
回答
在
使用
XGBoost
时,特性工程仍然有用吗?
、
我正在读与
XGBoost
有关的材料。这种方法不需要任何变量缩放,因为它是基于树的,这种方法可以捕捉复杂的非线性模式,相互作用。通常,
在
预测建模
中
,您可以在所有的特性中进行一些选择,也可以从所拥有的一组特性
中
创建一些新的特性。然后,这两点都应在
XGBoost
中
讨论。那么,这是否意味着要
使用
XGBoost
,您只需要明智地选择那些调优参数?
使用
XGBoost
进行特性工程有什么价值?
浏览 0
提问于2017-03-20
得票数 23
3
回答
将
python
scikit learn
模型
导出到
pmml
中
、
、
我想将
python
scikit-learn
模型
导出到
PMML
中
。我读过关于的文章,但我找不到任何
使用
scikit学习
模型
的例子。
浏览 2
提问于2015-10-20
得票数 21
3
回答
哪些
模型
可以处理空值?
、
、
不幸的是,试图搜索
或
研究机器学习
中
的空值总是会出现一些页面,试图教您如何将这些值计算出来,但是我正在尝试找到可以将空值作为输入处理的
模型
。我目前发现的唯一一个是
XGBoost
,它是一种梯度下降算法。
在
一些背景下,我创建了多个数据集,包括替换NaNs的数据集。这些可以用来训练不能处理空值的
模型
,比如神经网络。 由于数据的稀疏性
和
性质
,用平均值
或
中值来计算会带来很多偏见,这是毫无意义的。因此,回到最初的问题,除了
XGBoost</
浏览 0
提问于2020-01-28
得票数 5
2
回答
销售价格预测
、
、
我需要在这里
使用
时间序列概念吗?
浏览 0
提问于2018-11-06
得票数 0
回答已采纳
5
回答
不适应内存的大数据集预测建模
、
、
、
我正试图
在
我的本地计算机上建立一个大约10G大小的数据集之上的决策树
模型
。然而,我只有8G内存。我现在所做的只是随机抽样数据的某些子集,尝试不同的
模型
参数,并检查预测性能的科学工具包-学习包。不过,我仍然需要一个基于这些随机抽样结果的
模型
参数的最终
模型
,但显然我不能在整个数据集的基础上构建一个
模型
。这个问题我能做些什么?我是机器学习的新手,欢迎任何建议。谢谢!
浏览 0
提问于2016-09-19
得票数 3
3
回答
预测并行时间间隔
、
、
在
服务站可能同时有不同数量的车辆。我的任务是预测实际的开始
和
结束时间('ServiceTrueStart‘
和
'ServiceTrueEnd')
或
状态(
在
服务/不在服务
中
)
在
未来的某个时间点(
在
未来的x小时)。例如,假设我们现在有9:30,并且希望预测所有4辆车的真正开始/结束值(或在x小时内的状态):正如我们所看到的,车辆A
和
B已经
在
服务从9:00 (所以我们已
浏览 0
提问于2022-08-02
得票数 1
3
回答
确定为什么特征
在
决策树
模型
中
很重要
、
、
、
、
当我们检查
xgboost
或
sklearn
梯度增强
模型
的特征重要性时,我们可以确定特征的重要性。但我们不明白为什么这些功能是重要的,对吗?我被告知要
使用
,但即使运行一些样板示例也会引发错误,因此我正在寻找替代方法(甚至只是一种检查树
和
收集洞察力的过程方法,
而
不是plot_importance()图)。在下面的示例
中
,如何解释为什么特性f19是最重要的(同时也意识到决策树是随机的,没有random_state
或
种子)。我希望看到代码(<e
浏览 11
提问于2017-11-04
得票数 10
回答已采纳
11
回答
如何在
xgboost
中
获取特性重要性?
、
我正在
使用
{}构建
模型
,并尝试
使用
xgboost
查找每个特性的重要性,但它返回
xgboost
dtrain = xgb.DMatrix(X, label=Y) watchlist =如何在
xgboost
中
获取特性重要性?
浏览 1
提问于2016-06-04
得票数 52
1
回答
在
XGboost
中表示数值分类数据(特别是小时)变量的正确方式是什么?
、
、
、
、
是只
使用
一个主代码更好,还是只把它作为一个数字变量?我在网上读到了复杂的结论:"(onehotencoded)这是
xgboost
或
任何其他机器学习工具的分类变量的正确表示。“
浏览 2
提问于2019-11-19
得票数 1
1
回答
在
未见数据上实现
sklearn
的FeatureHasher
、
、
、
对于一些背景知识,我一直致力于医疗保险索赔的二进制分类,并正在实现
sklearn
的FeatureHasher来向量化分类功能,其中许多特性
在
基数上特别高,具有高计数的独特因素级别,
而
sklearn
的FeatureHasher我已经
在
我的初始训练集上训练了一个
XGBoost
分类器,它被转换成每个分类特征被散列为log (x )维(x是每个特征
中
唯一的因子级别的数目)。我计划
使用
经过训练的
模型
对新的/未见的索赔数据进行预测,这些
浏览 0
提问于2020-04-27
得票数 0
6
回答
如何从Java调用scikit-learn分类器?
、
、
、
我有一个分类器,它是我用
Python
的scikit-learn训练的。如何
使用
Java程序
中
的分类器?我可以
使用
Jython吗?有没有什么方法可以用
Python
保存分类器并用Java
加载
它?有没有其他的方法来
使用
它?
浏览 7
提问于2012-10-05
得票数 34
回答已采纳
3
回答
xgboost
:拆分候选搜索的缺失值的处理
、
、
、
、
在
的3.4节
中
,作者解释了当搜索用于树生长的最佳候选分裂时,他们如何处理缺失值。具体地说,它们为在当前实例集中具有缺失值的节点创建默认方向,作为拆分特征。
在
预测时,如果预测路径经过此节点,并且缺少特征值,则遵循默认方向。 然而,当特征值
丢失
并且节点没有默认方向时,预测阶段会崩溃(这在许多情况下都会发生)。换句话说,它们如何将默认方向关联到所有节点,即使是那些
在
训练时设置的活动实例
中
具有无缺失拆分功能的节点?
浏览 7
提问于2016-06-03
得票数 10
5
回答
范畴变量的大no与范畴的大no
、
、
、
、
例如:其中一个有310个类别,但前10个最常见的变量占训练
和
测试数据的50%。我正在考虑保持这些顶部k频繁出现的值,并将所有其他值编码为另一个类别的“其他值”。谢谢您抽时间见我。 PS:数据而非时间序列
浏览 0
提问于2019-06-04
得票数 5
1
回答
使用
vgg16验证集的准确性低
、
、
、
、
batch_size = batch_size,然后,我
使用
转移学习
和
VGG16来训练我的
模型
:from keras.layers import Input, Dense, Flattenpredictions) model.compile(optimizer='
浏览 2
提问于2020-06-11
得票数 0
19
回答
由于EnvironmentError:[Errno 13]无法安装软件包
、
、
在
我的MacOS Mojave终端
中
,我想安装一个带有pip的
python
包。但是我得到了一个错误:'/Library/
Python
还意识到它在错误消息
中
写了
Python
2.7,但是我已经并且希望只
使用
python
3.thon3。
浏览 0
提问于2018-10-23
得票数 229
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用 Java 调取 Python、R 的训练模型?
机器学习:XGBoost 安装及实战应用
如何使用XGBoost和InluxDB进行时间序列预测
SPA 大赛:win10 python3.5.X 下开启 lightgbm 支持
数据挖掘中的利器——XGBoost理论篇
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券