腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8527)
视频
沙龙
1
回答
ML
决策树
分类
器
仅在
相同
的
树上
拆分
/
询问
相同
的
属性
、
、
、
、
我目前正在制作一个
决策树
分类
器
,使用基尼系数和信息增益,并根据每次增益最大
的
最佳
属性
来
拆分
树。但是,它每次都会粘贴
相同
的
属性
,并简单地调整其question
的
值。这导致了非常低
的
准确率,通常在30%左右,因为它只考虑了第一个
属性
。找到最佳
拆分
# Used to find the best split for data among all attributes
浏览 11
提问于2020-12-07
得票数 0
回答已采纳
1
回答
scikit adaboost feature_importance_
、
、
在python中实现
的
adaboost算法是如何为每个特性分配特性重要性
的
?我正在使用它进行特征选择,我
的
模型在基于feature_importance_值
的
特征选择方面表现得更好。
浏览 4
提问于2016-04-16
得票数 4
回答已采纳
2
回答
决策树
ID3算法中选择分区背后
的
直觉
、
、
、
我正在尝试理解
ML
中
决策树
分类
器
背后
的
直觉。我知道
决策树
中每个节点
的
目标是进一步划分可能标签的当前空间,以便根据该节点上给定问题
的
答案来消除尽可能多
的
候选标签。但是,这与基于最小化分区“熵”
的
属性
选择分区有什么关系?其中“熵”
的
定义如下: q_i's: proporti
浏览 5
提问于2016-03-20
得票数 1
3
回答
“
拆分
属性
”可以在
决策树
中多次出现吗?
、
、
只想澄清一件事:
相同
的
属性
可以在
决策树
中多次出现,只要它们在不同
的
“分支”中,对吗?
浏览 0
提问于2013-11-15
得票数 7
回答已采纳
2
回答
弱
分类
器
、
、
、
我正在尝试实现一个使用AdaBoost算法
的
应用程序。我知道AdaBoost使用一组弱
分类
器
,但我不知道这些弱
分类
器
是什么。你能用一个例子给我解释一下吗?如果我必须创建自己
的
弱
分类
器
,或者我需要使用某种算法,你能告诉我吗?
浏览 0
提问于2012-08-24
得票数 15
回答已采纳
1
回答
多次运行
决策树
分类
器
有帮助吗?
首先,我是
ML
技术
的
新手。最近,我不得不编写一个基于scikit-learn
的
决策树
分类
器
来对真实
的
数据集进行训练。有人建议我必须运行mu模型几千次,并在图表上绘制精确性图。问题是:我手动运行了20-30次,每次都给出了
相同
的
精度(无论是gini还是entropy )。这样做不对吗?每一次都会有轻微
的
变化吗?
浏览 0
提问于2018-08-24
得票数 0
回答已采纳
2
回答
WEKA -
分类
-训练和测试集
、
我正在使用3个不同
的
分类
器
执行
分类
问题,即
决策树
,朴素贝叶斯和IBK。我有两个数据集,它们在布局和
属性
名称上是
相同
的
,但每个数据集中
的
值是不同
的
。ViolentCrimesPerPop Rate 我希望我
的
决策树
使用12个<e
浏览 3
提问于2015-12-30
得票数 2
1
回答
决策树
完整性与非
分类
数据
、
、
我编写了一个程序,在ID3算法
的
基础上,使用信息增益函数(Shanon熵)训练
决策树
,用于特征选择(split)。一旦我训练了一棵
决策树
,我就对它进行了
分类
,我意识到有些数据实例不能被
分类
:
树上
没有路径来对实例进行
分类
。一个示例(这是一个示例,但我遇到了一个更大、更复杂
的
数据集
的
相同
问题): y:y1
浏览 0
提问于2016-03-16
得票数 1
回答已采纳
4
回答
特征重要性语境下
的
决策树
解释
、
、
、
、
我试图了解如何充分理解
决策树
分类
模型
的
决策过程。我要看
的
两个主要方面是树
的
图形表示和特性重要性列表。我不明白
的
是特性
的
重要性是如何在树
的
上下文中确定
的
。例如,下面是我
的
特性重要性列表:FeatureJ (0.039006)FeatureL (0.008136)然而,当我看到树
的
浏览 0
提问于2017-02-02
得票数 13
回答已采纳
2
回答
查找名义
属性
的
所有二进制
拆分
、
、
、
、
问题我坚持
的
一个步骤是找到所有可能
的
方法来计算名义
属性
的
二进制
拆分
。例如,对于一个可能值为a、b、c、d
的
属性
,我正在寻找一种将这些数组
拆分
为两个数组
的
方法,以便我们获得:
浏览 6
提问于2016-10-20
得票数 2
回答已采纳
1
回答
在sklearn.tree.DecisionTreeClassifier中处理连续变量
、
、
、
、
我很好奇sklearn如何处理sklearn.tree.DecisionTreeClassifier中
的
连续变量?我尝试使用一些连续变量,而不需要对DecisionTreeClassifier进行预处理,但是它
的
精度是可以接受
的
。 下面是一种将连续变量转化为范畴变量
的
方法,但不能获得
相同
的
精度。
浏览 2
提问于2019-12-08
得票数 1
回答已采纳
4
回答
如何在数据集中使用连续变量和
分类
变量创建
决策树
?
、
假设我在一个数据集中有3个
分类
属性
和2个连续
属性
。如何使用这5个变量构建
决策树
?编辑: 对于
分类
变量,可以很容易地说,我们只将它们除以{yes/no}并计算出gini
的
总增益,但是我
的
怀疑主要是关于连续
属性
的
。假设我有一个像{1,2,3,4,5}这样
的
连续
属性
的
值。我
的
分裂点选择是什么?它们是在每个数据点(如{<1,>=1......&am
浏览 0
提问于2018-06-04
得票数 24
回答已采纳
1
回答
具有
分类
特征
的
决策树
、
我正在实现一个
决策树
。假设“种族”特征具有以下可能
的
价值:‘亚洲-太平洋-岛民’、‘Amer-印第安-爱斯基摩’、'White‘、'Other’、'Black‘注意,这些值是分组在一起
的
-“排序”。假设熵差告诉我,以下是最佳
的
浏览 3
提问于2016-04-08
得票数 0
回答已采纳
1
回答
GBM方法
的
性能是否得益于特征缩放?
、
我知道特征缩放是建立人工神经网络模型
的
重要预处理步骤. 但是梯度升压机呢,比如LightGBM、XGBoost或CatBoost呢?它们
的
性能是否从功能扩展中获益?如果是,为什么和如何?
浏览 0
提问于2020-07-07
得票数 4
回答已采纳
3
回答
Python中
决策树
的
序数特性
我有一个带有序数features.Each特性
的
数据集,可能有6到7个级别。基于我对R
的
搜索,如果你有序数数据,rpart对序数和标称
的
处理方式不同。://stats.stackexchange.com/questions/94502/decision-tree-splitting-factor-variables 但是现在我正在用Python实现
决策树
Python似乎不能很好地处理
分类
数据,我不得不使用一种热编码。在这种情况下,级别1到级别2到level
浏览 0
提问于2019-09-05
得票数 0
2
回答
韦卡-我如何检查是否有过火
的
韦卡?
、
编辑:您说过,如果存在过度拟合,测试集(我称之为验证集)
的
性能会严重下降?
浏览 3
提问于2013-05-29
得票数 2
1
回答
Azure机器学习
决策树
熵/信息增益
、
、
、
在Azure
ML
中训练
决策树
时,是否有方法可以看到每个特性
的
熵/信息增益?
浏览 4
提问于2016-03-09
得票数 0
回答已采纳
1
回答
在“标准”随机森林中使用哪一种
决策树
模型?
、
也许还有一个更普遍
的
问题: 既然C5.0树通常比CART有更好
的
性能,为什么人们仍然使用CART来构建随机森林(或者人们已经在这样做了)?
浏览 0
提问于2020-02-15
得票数 1
3
回答
XGBoost:最大限度地减少连续线性特征
的
影响,而不是
分类
、
、
、
、
假设我有100个独立
的
特征- 90是二进制(例如0/1),10是连续变量(例如年龄、身高、体重等)。我用这100个特征来预测一个有足够数量样本
的
分类
器
问题。当我设置一个XGBClassifier函数并对其进行拟合时,从gain
的
角度来看,最重要
的
10个特性总是10个连续变量。目前,我对cover或frequency不感兴趣。10个连续变量在.8列表中占用空间
的
.9 (和(增益)= 1)。 我试着调gamma,reg_alpha,reg_lambda,max_d
浏览 1
提问于2018-07-30
得票数 3
回答已采纳
2
回答
决策树
中
的
多元
分类
是什么?
、
、
我是新领域的人工智能和阅读有关
决策树
。我指的是AIMA
的
书,这几乎是标准
的
介绍人工智能书推荐。在关于
决策树
的
章节中,他们在书中讨论了一个案例,在第一个
属性
分裂之后,没有剩下
的
属性
,但正负两个例子仍然没有分开,这意味着这些例子具有完全
相同
的
描述.他们建议
的
解决方案是“返回剩余示例
的
多个
分类
”。返回一组示例
的
“多元
分类
”是什么意思?
浏览 3
提问于2013-03-26
得票数 10
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
你听过CatBoost吗?本文教你如何使用CatBoost进行快速梯度提升
《机器学习实战》读书笔记系列(三):决策树上集
机器学习小知识
Scikit-learn笔记10 Bagging
机器学习100天-Day1704决策树
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券