腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
XGBoost
以
列
列表
而
不是
图
的
形式
获取
要素
重要性
、
、
我想知道您是否可以将特征
重要性
表示为
列
的
列表
而
不是
曲线图。这就是我
的
东西 xg_reg = xgb.train(params=params, dtrain=data_dmatrix, num_boost_round=10)plt.rcParams['figure.figsize'] = [5,5] plt.show() 这就给了我
浏览 16
提问于2020-07-24
得票数 1
回答已采纳
1
回答
特征
重要性
绘图使用xgb和护林员。最好
的
比较方法
、
、
根据基于rmse
的
最佳性能,其中一种或另一种用于针对搁置数据进行测试。> xgb.importance(model = regression_model)然后我就可以把它画成这样 > xgb.importance(model = regression_mode
浏览 2
提问于2020-01-13
得票数 0
回答已采纳
1
回答
xgboost
与H2o梯度提升
、
我有一个数据集有大量
的
缺失值(超过40%
的
缺失值)。在
xgboost
和H2o gradient boosting中生成一个模型-在这两种情况下都得到了一个像样
的
模型。然而,
xgboost
将此变量显示为模型
的
关键贡献者之一,但根据H2o,梯度提升该变量并不重要。
xgboost
会
以
不同
的
方式处理缺少值
的
变量吗?两个型号
的
所有配置都完全相同。
浏览 0
提问于2017-06-21
得票数 2
11
回答
如何在
xgboost
中
获取
特性
重要性
?
、
我正在使用{}构建模型,并尝试使用
xgboost
查找每个特性
的
重要性
,但它返回
xgboost
dtrain = xgb.DMatrix(X, label=Y)num_round = 200那么我
的
火车上有什么差错吗如何在
xgboost
中
获取
浏览 1
提问于2016-06-04
得票数 52
1
回答
在特征
重要性
和特征选择之后重建和训练新
的
深度学习Python模型
以
减少特征量?
、
、
、
我有一个427名患者
的
数据集,在这些患者
的
遗传标记(2687
列
)上,甲基化速率被确定为从0到1 (0 =未甲基化,1=完全甲基化)。我使用了
xgboost
,我得到了一个节点
图
,并通过
xgboost
重命名了特征(所以我
的
第一个问题是,我不知道这些
xgboost
图
的
标签真正代表了什么标记(显然有3个测试(6个“是”或“
不是
”决策树,
图
.a),
xgboost
可以确定患者
浏览 20
提问于2019-05-18
得票数 1
3
回答
绘图
重要性
变量
xgboost
、
、
、
、
当我绘制特征
重要性
图
时,我得到了这个混乱
的
图
。我有超过7000个变量。我知道内置函数只选择最重要
的
部分,尽管最终
的
图形是不可读
的
。array[:,0:7803]from
xgboost
import XGBClassifier from sklearn.model_selection importX_train, X_test, y_train, y_test = train_test_split(X,Y,test
浏览 3
提问于2018-08-18
得票数 12
回答已采纳
3
回答
如何在不重新训练模型
的
情况下获得
XGBoost
特征
重要性
图中
的
实际特征名称?
、
、
我已经训练了我
的
XGBoost
模型,但使用
的
是预处理数据(使用MinMaxScaler
的
中心和尺度)。因此,我遇到了列名/功能名丢失
的
类似情况。因此,当我尝试使用plot_importance(my_model_name)时,它会导致绘制特征
重要性
图
,但只有f0、f1、f2等特征名称,
而
不是
数据集中
的
实际特征名称,这一点必须很明显。大多数关于SO
的
答案都与
以
一种不丢失特征
浏览 1
提问于2019-03-01
得票数 17
3
回答
确定为什么特征在决策树模型中很重要
、
、
、
、
当我们检查
xgboost
或sklearn梯度增强模型
的
特征
重要性
时,我们可以确定特征
的
重要性
。但我们不明白为什么这些功能是重要
的
,对吗?我被告知要使用,但即使运行一些样板示例也会引发错误,因此我正在寻找替代方法(甚至只是一种检查树和收集洞察力
的
过程方法,
而
不是
plot_importance()
图
)。我希望看到代码(
而
不是
理论),您将如何检查实际模型并确定每个特性
的
浏览 11
提问于2017-11-04
得票数 10
回答已采纳
1
回答
如何使用category_encoder包
获取
二进制编码
的
原始值
、
、
、
、
我想将这些包含在
XGBoost
模型中,
以
进行分类预测。我知道One热编码是解决这个问题
的
首选方法,但我宁愿做一些不会增加太多维数并且对新值有弹性
的
事情,所以我尝试使用category_encoders包进行二进制分类。http://contrib.scikit-learn.org/categorical-encoding/binary.html 使用此编码帮助我
的
模型摆脱了使用基本
的
one-hot编码,但编码后如何返回到原始标签towardsdat
浏览 25
提问于2019-05-29
得票数 5
4
回答
如何为每个类找到最重要
的
属性
、
、
、
、
我有一个有28个属性和7个类值
的
数据集。我想知道是否有可能找到最重要
的
属性(S)来决定每个类
的
类值。例如,一个答案可以是:属性2对1类最重要,属性6对2类最重要,或者更明智
的
答案是:属性2< 0.5对第1类最重要,属性6> 0.75对第2类最重要等等。我最初
的
方法是在数据上构建一个决策树,并找到每个类
的
信息增益/增益比最大
的
节点,这将是该类最重要
的
决定因素。问题在于,我发现
的
决策树实现没有给出每个节点
的<
浏览 0
提问于2018-10-16
得票数 2
1
回答
addPolylines需要数字经度值/纬度值-但我
的
值是经纬度/lng数值
、
这是一个简短
的
(我希望)。我正试着用传单画出我所在城市
的
自行车路线。但是addPolylines()不喜欢我
的
代码。这里有什么问题?
浏览 12
提问于2021-09-02
得票数 0
回答已采纳
1
回答
ML模型
的
重要性
信息来自因果
图
的
距离或接近程度如何?
、
标题很大程度上涵盖了我
的
问题,但为了详细说明它:对于二进制分类问题(同样,对于简单性,并给出处理和控制组
的
“感觉”),如果我们使用机器学习模型(例如随机森林),我们最终会从经过训练
的
模型中获得特征
重要性
该培训利用上下采样或其他方法处理数据不平衡,并使用适当
的
样本,如在训练和验证期间分层,
以
模拟随机对照试验。我们还假设特性
列表
中有所有的混淆,即不再有其他混淆。我知道,ML模型只希望了解相关性,
而
不希望了解特性之间
的
因果关系。特征
浏览 0
提问于2020-06-06
得票数 1
2
回答
从连接表中
以
行
的
形式
获取
列
,
而
不是
以相邻
列
的
形式
获取
列
、
、
我希望得到这样
的
输出,即A_PRODUCT表中
的
行后面是A_MODEL表中
的
行,然后是产品
的
A_AREA表中
的
行。以下是用于创建示例数据
的
SQL: CREATE TABLE A_PRODUCTPRODUCT_ID NVARCHAR(30),); VALUES ('A
浏览 14
提问于2019-06-26
得票数 1
回答已采纳
1
回答
SharePoint使用查找下拉
列表
和
获取
值
、
、
、
我似乎在从下拉查找字段中
获取
返回值时遇到了一些问题。我有下面的代码,它从我要查找
的
列表
中
获取
值: }} 它执行得很好,给了我下拉
列表
浏览 11
提问于2017-01-26
得票数 1
回答已采纳
1
回答
Python - Scikit找到分类变量
的
变量
重要性
、
、
、
、
我正在尝试使用python中
的
scikit learn来做一些不同
的
分类器问题(RF,GBM等)。除了建立模型和进行预测之外,我还希望看到变量
的
重要性
。我知道有一种方法可以让你print(importances) 但是,我如何才能得到与变量名(即R中
的
summary(gbm)或R中
的
varImp(randomForest) )相关
的
更精确
的
东西,特别是如果它是一个多层<em
浏览 1
提问于2015-03-20
得票数 8
1
回答
用KMeans解释集群中实例之间
的
相似之处
、
如果我使用KMeans中
的
聚类算法创建集群,有什么方法可以找到哪些属性用于将这些实例分组到集群中? 示例:我有一个列为1-10
的
汽车数据集。我得到了3个集群,如何知道使用了哪些属性来生成它们?是因为集群1中
的
所有实例在第2
列
和第3
列
中都具有相同
的
值吗?
浏览 0
提问于2021-04-05
得票数 0
1
回答
如何使用python在表中显示多个jpeg图像?
、
、
、
、
我
的
目录里有一些jpeg。我想在窗口中
以
行和
列
的
形式
显示它们。例如,如果我有10幅图片,我想要显示2行5
列表
。2-如何使用matplotlib实现这一点? 3-如何在浏览器中使用木星做这件事?
浏览 1
提问于2018-10-01
得票数 2
回答已采纳
1
回答
以
子
图
而
不是
顶点
的
形式
获取
结果: Gremlin - orient-db
、
、
我正在使用java中
的
Gremlin和orient db。我能够使用可用
的
方法查询我
的
顶点和边,并获得结果。我使用back("Alias-name")来获得查询
的
结果顶点。我
的
问题是,我能否获得所有结果顶点
的
图
(相关
图
和结果信息),因为现在我可以获得顶点,但我希望在同一查询中获得结果顶点
的
整个“子
图
”信息。 任何帮助都是非常感谢
的
。下面是一个包含通用示例
的
代码:
浏览 0
提问于2014-04-07
得票数 0
1
回答
CGI/Ruby -将字符串转换为整数
、
下面是我
的
test.cgi文件。从html传入
的
参数是:为什么a.class没有显示为整数?即使是Ruby
的
.to_i也不能工作。 #!
浏览 0
提问于2015-09-17
得票数 0
1
回答
R中
的
xgboost
中的人类可读规则
、
我尝试在R中使用
xgboost
从我
的
数据中
获取
规则(gbtree),这样我就可以在其他系统中使用这些规则(
而
不是
带有‘predict’
的
预测数据)。输入数据有appr。具有二进制稀疏数据
的
1500
列
和40兆行,并且标签也是二进制
列
。library(
xgboost
) labels <- data.frame(labels = sample.int(2, m*1, TRUE)-1L
浏览 12
提问于2017-03-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券