决策树算法例题_dijkstra算法步骤例题_最坏适应算法例题 - 腾讯云开发者社区

可以使用什么标准来决定是否使用oneR或jRip(包含在RWeka中)来开发决策树或一个或多个规则。这两种算法(决策树和规则)的相似性很高，使其有点混乱。

浏览 0提问于2016-04-26得票数 1

回答已采纳

2回答

决策树:冲刺对SLIQ？

、

我发现了不同类型的决策树，例如SPRINT和SLIQ方法。这两种方法都用于解决分类问题，使用Gini索引进行特征选择并遵循步骤(根据幻灯片8上的这 )：开始对样本进行预分类。只要没有达到停止标准:对于每个属性:将所有节点放置到类直方图中，并开始对拆分进行评估。选择一个分裂。更新决策树；对于每个新节点，更新其类列表(节点)。所以，我的问题是: SPRINT算法和SLIQ算法有什么区别？

浏览 0提问于2022-03-29得票数 1

回答已采纳

1回答

利用交叉熵建立决策树分类器

、

熵和交叉熵是否与基本定义相同？如果有不同之处：决策树分解取熵或基尼指数，可以用交叉熵来分割决策树吗？或者，在运行决策树算法之后，我应该使用它作为评估指标吗？此外，决策树算法是否假定有任何分布？如果是，那么我们如何使用KL发散度呢？我只是想把几个概念从更广泛的角度联系起来。以下是我对多类决策树的关注。

浏览 0提问于2020-01-16得票数 2

1回答

我正在处理一个相当大的数据集(770K记录，2K属性，几乎所有这些属性都是二项式的，但都是整数形式的)，我想通过10折交叉验证将决策树应用于数据，但我遇到了一些问题： 1.为什么决策树(例如深度为10的决策树)需要这么多时间来训练？实际上，在训练树之前，我平衡了数据(因为它是不平衡的)到原始大小的40% (~320K记录)，但这仍然需要很多时间，有没有其他版本的决策树可以产生相同的性能和更少的时间？(将属性设置为二项式形式是否会使其更快?) 2.如何优化决策树的参数？我应该在整个X-validation上对其进行优化吗？

浏览 1提问于2012-12-30得票数 0

1回答

随机森林与RainForest之争

、、

我研究过随机林和RainForest的论文，但它们有点让人困惑！总之，我理解这些算法的以下步骤。你能帮我查出我说的对不对吗？谢谢你的帮助。在兰登森林第一：定义树数通过引导来划分数据在每个分区构造树上(在每个节点中选择一个特征子样本) 标签叶节点用于对新实例进行分类时，可以对所有树进行投票。在RainForest中：分区数据集构建AVC-分区集通过计算AVC-集上的纯度标准(如gini-索引)，在分区上构建树。

浏览 0提问于2018-05-16得票数 2

回答已采纳

2回答

关于决策树的问题

、、、

在研究了决策树一段时间后，我注意到有一种小技术叫做boosting。我看到在正常情况下，这将提高决策树的准确性。所以我只是在想，为什么我们不简单地将这种增强合并到我们建立的每个决策树中呢？由于目前我们将boosting作为一种单独的技术，所以我在思考:使用boosting比只使用单个决策树有什么缺点吗？谢谢你在这里帮我！

浏览 3提问于2010-11-24得票数 1

回答已采纳

1回答

带有Adaboost的决策树/树桩

、、

我刚开始与Adaboost一起学习决策树，并在OpenCV上试用，并有一些问题。增强决策树我知道，当我使用Adaboost与决策树，我不断地拟合决策树，以重新加权版本的培训数据。分类以加权多数票进行。当使用Adaboost训练决策树时，我可以使用引导吗？也就是说，我们选择数据集的子集，并在每个子集上训练一棵树，然后将分类器输入Adaboost。增强决策桩我是否对决策桩使用同样的技术？或者我可以创建与功能数量相等的树桩吗？也就是说，如果我有两个有10个特性的类，在将分类器输入Adaboost之前，我会为每个特性总共创建10个决策集。

浏览 8提问于2016-08-08得票数 1

回答已采纳

2回答

决策树是试图最大化信息获取还是熵？

、、、

据我所知，决策树试图将高熵的分类器放在决策树上。然而，信息的获取是如何发挥作用的呢？信息增益被定义为： InformationGain = EntropyBefore - EntropyAfter 决策树是否试图将信息增益较低的分类器放置在树的顶部？那么，熵总是最大化，信息增益总是最小化吗？对不起，我只是有点糊涂。谢谢!

浏览 1提问于2013-12-19得票数 6

1回答

有决策树的Adaboost (自适应增强)方法的例子是什么？

、、、

有什么好的教程可以解释如何在为样本训练集构建决策树的连续迭代过程中对样本进行加权？我想明确地说，在构建第一个决策树之后，如何分配权重。决策树是使用信息增益作为锚来设计的，我想知道这是如何由于先前迭代中的错误分类而受到影响的。任何好的教程/例子都是非常感谢的。

浏览 2提问于2014-09-21得票数 3

回答已采纳

1回答

什么时候决策树比神经网络表现得更好？

、、、

我试验了不同的建模方法，包括KNN、决策树、神经网络和SVN，并试图对我的数据进行拟合，看看哪种方法最有效。令我惊讶的是，决策树的最佳工作方式是训练精度为1.0，测试精度为0.5。无论训练精度为0.92，测试精度为0.42，神经网络的性能都是最好的，比决策树分类器低8%。请有人解释一下，与决策树这样的建模技术相比，神经网络可能具有低精度的情况/情况。我尝试过不同配置的神经网络，比如： 1 hidden layer and 1 neuron : Train Accuracy 34% Test Accuracy 42% 7 hidden layers and 5 neurons in each

浏览 0提问于2018-09-16得票数 9

1回答

如何在scikit learn中设置决策树分类器的分支数？

、

我正在使用scikit-learn，但不知道如何设置决策树的分支数……对于决策树，二叉树是最优的吗？

浏览 1提问于2019-10-24得票数 0

1回答

连续目标变量的决策树

我正在尝试构建一个决策树，其中我在r.which决策树中混合了自变量和连续因变量，我可以应用吗？我不想使用购物车，因为我想要2个以上的分割。

浏览 7提问于2015-08-20得票数 0

3回答

决策树实现(ID3或C4.5)

、、、

我想用PHP实现一个决策树(机器学习)算法。我在谷歌上到处搜索，在PHP中什么也找不到。有没有人知道PHP中实现决策树的教程或函数？

浏览 0提问于2011-11-18得票数 4

4回答

在决策树中处理异常值和空值

、、、

离群值:据我所知，决策树对异常值是稳健的。有人能证实我的假设是否正确吗？(如果我的特征从0到9不等，但存在一个值为10000的异常值，那该怎么办？)它是否为这个离群点样本创建了一个单独的叶子，还是会与其他树的叶子合并？空值:在使用决策树建立模型之前，我们需要替换空值吗?还是由决策树技术自动处理？谢谢。

浏览 0提问于2018-05-09得票数 6

回答已采纳

2回答

在随机森林中使用什么样的决策树？

、、

阅读一些文档(对于示例)，我知道有很多类型的决策树(Cart、ID3等等)。我还知道，随机森林是一种使用一组决策树的粒子算法。我的问题是:在随机森林中，使用什么样的决策树？(cart，id3，.)

浏览 0提问于2022-03-21得票数 0

回答已采纳

1回答

利用可视化垂直线对数据点进行分类

、、、

我目前正在做硕士论文，在毕业后，我的导师提出了一些问题。我已经回答了大部分的问题，但只剩下一个问题，我不知道如何回答。我的硕士论文是将给定的医学数据分类为癌症或免疫，预处理后的数据点的可视化看起来如下所示， 📷 现在，我已经使用支持向量机与核、决策树和随机森林算法对数据点进行分类，它们获得了很好的精度和F1评分，但我的主管提出了以下问题我几乎可以通过绘制三条垂直线来完美地分类这些数据。相反，提供了非常复杂的决策树。应该讨论为什么绘制这三条垂直线是不合适的，或者如果是，为什么算法找不到它们。根据决策树分类器的质量应与我提出的简单方法进行比较。。所以你能不能分享一下你对这个问题的了解并帮助

浏览 0提问于2022-10-30得票数 1

1回答

决策树完整性与非分类数据

、、

我编写了一个程序，在ID3算法的基础上，使用信息增益函数(Shanon熵)训练决策树，用于特征选择(split)。一旦我训练了一棵决策树，我就对它进行了分类，我意识到有些数据实例不能被分类：树上没有路径来对实例进行分类。一个示例(这是一个示例，但我遇到了一个更大、更复杂的数据集的相同问题)： f1和f2是预测变量(特性)，y是范畴变量，值范围为： f1：a1；a2；a3 f2：b1；b2；b3 y：y1；y2；y3 培训数据： ("a1“、"b1”、"y1")；("a1“、"b2”、"y2"

浏览 0提问于2016-03-16得票数 1

回答已采纳

1回答

决策树与维数的诅咒

、、

由于决策树算法一次分割训练数据集，那么它又是如何遭受维数诅咒的呢？

浏览 0提问于2018-05-18得票数 1

2回答

在spark决策树中使用什么算法(是ID3、C4.5还是CART)

、

我有一个关于MLlib中决策树的问题。Spark中使用的是什么算法？是ID3，C4.5还是CART？

浏览 5提问于2016-12-07得票数 8

2回答

、

我正在处理包含1200个属性和450个实例的受监管数据。我尝试了许多决策树，以获得良好的准确性，但没有一个给我最好的解决方案，如ADtree (交替决策树)给了我。问题是ADtree使用的是Boosting算法，据我所知，这些算法并不是很好，因为它们会在训练和测试中造成重复的失灵。我的工作需要验证(通过交叉验证)，我不确定我是否能够使用ADtree。我的问题是:我可以使用这棵树吗？

浏览 1提问于2013-12-23得票数 0

1回答

通过Weka的决策树在R中运行统计测试

、、

我正在试图弄清楚如何做到这一点，但谷歌似乎没有找到答案。我有一个很好的数据集，我能够在Weka中生成修剪和未修剪的决策树。从这里我可以得到10倍的交叉验证信息，这是很好的。但我想使用R在两个决策树之间运行统计测试，即T-Test或Wilcoxon，使用R。有人建议我使用DMwR和RWeka包，但由于我以前没有使用这种语言的经验，阅读RWeka文档并在谷歌上搜索教程或其他解释，我一无所获。

浏览 2提问于2012-09-25得票数 1

2回答

、、

关于我的目标的细节:我正在使用IMDb数据和Youtube电影预告片数据来预测电影的总量。具体来说，我使用“范围”、“总量”、“预算”、“imdb_score”、“视图”、“评级”来进行分类。因此，我通过KNN和决策树1)来预测电影的成功，同时也知道哪种机器学习会更准确。但问题是，我的knn结果 feature_columns = ['range', 'gross', 'budget','imdb_score','views','rating'] X = df2[feature_columns]

浏览 4提问于2019-12-09得票数 0

1回答

决策树学习是“半监督”的吗？

、、、

我有一个数据集，其中包括三种类型的变量:自然状态，人类决策，响应变量。我正在尝试使用决策树学习来使用其他变量来预测响应变量。我的心理模型是，人们看着自然的状态并做出决定。因此，我强烈希望我的决策树首先根据自然变量的状态进行分区，然后根据人类决策变量进行分区。我不希望只是丢弃决策树模型中的所有变量，然后看看会弹出什么。这个心理模型是有效的吗?如果是的话，我该如何使用Azure ML实现这样的东西呢？我甚至不知道用什么词来描述这个问题--这是“半监督”决策树学习吗？

浏览 3提问于2016-04-27得票数 0

3回答

有没有可能在没有决策树的情况下建立集成模型？

、、、、

有没有可能在没有决策树的情况下建立集成模型？我知道，对组合的描述本身就意味着不同。然而，我对机器学习还是很陌生的，到目前为止，我遇到的所有集成模型都使用决策树或使用决策树进行描述。

浏览 0提问于2021-09-28得票数 6

2回答

Azure机器学习决策树输出

、、

在ML中，是否有任何方法获得增强的决策树模块的输出？分析这棵博学的树，比如在Weka。

浏览 2提问于2015-10-07得票数 0

回答已采纳

1回答

在研究中可以把套袋法作为决策树的改进技术吗？

、、、

套袋采用决策树作为分类器。在解决问题过度拟合问题的研究中，我希望以决策树(c4.5)作为改进决策树(c4.5)的方法。这有可能是因为一些讲师说不对，因为套袋，其他分类器不是混合的两种？

浏览 0提问于2020-09-21得票数 2

回答已采纳

1回答

如何选择拆分决策树的顺序？

、

我知道决策树沿着每个属性递归地分裂，贪婪地将错误的分类/偏差降到最小。但是，属性被拆分的顺序是什么呢？换句话说，对于N维的回归树，是什么决定了哪个属性首先被分割？

浏览 0提问于2015-10-01得票数 1

1回答

根据数据创建决策树

、、

我试图从数据中创建决策树。我用树来猜动物游戏之类的应用。用户用“是”/“否”回答问题，程序猜测答案。这个节目是用来做作业的。我不知道如何从数据中创建决策树。我无法知道什么将是根节点。每次都会有不同的数据。我不能用手做。我的数据如下： Animal1: property1, property3, property5 Animal2: property2, property3, property5, property6 Animal3: property1, property6 etc. 我搜索了堆栈溢出，找到了ID3和C4.5算法。但我不知道我是否应该使用它们。有人能指点我，我应该用什么算法

浏览 4提问于2015-06-23得票数 2

回答已采纳

1回答

决策树:推荐图书馆

、、、

我想知道，是否有用于决策树的推荐库。对我来说，最好的laguages是Java (最简单)和PHP (长期有用)。我需要他们的论文在大学，并希望以后使用的代码作为一个网络服务。这个问题本身并不重要，可以通过各种方式加以解决。但作为一个条件/约束，我不得不使用决策树。我寻找了一段安静的时间，但没有发现真正的粉碎。所以我决定问你。正如我所说的，Java对我来说是最简单的。类似Java的语言也是如此(C++，.)。PHP将是最有用的，因为我希望稍后在服务器上使用该代码的片段。而且，前端编程要容易得多;-)其他托管支持的语言也可以，但我还不熟悉它们。功能不需要非常复杂，因为问题不是基于决策树的

浏览 1提问于2016-01-05得票数 1

回答已采纳

3回答

学习:缺少决策树的剪枝

、、

为什么剪枝目前不支持在科学工具包-学习？我们如何调整决策树以找到解决办法？

浏览 0提问于2017-12-28得票数 3

回答已采纳

1回答

我可以使用决策树来比较属性对的值吗？

、

我想使用决策树进行二进制分类。我想知道我的方法是否是决策树的有效方法。我的数据集中的每个实例都有一对属性，并且我已经确定了对于某些对，我可以比较值来做出决定。例如，实例可能具有以下属性：实例= {A1，A2，A3，A4，B1，B2，B3，B4} A1和B1有不同的值，但是引用相同的特性--这是我把它们称为对时的意思。我想要做的是在树中有比较一对值的节点： (A1 > B1) / \ (A2 < B2) (A3 > B3) / \ /

浏览 6提问于2014-04-26得票数 2

1回答

为什么不能在决策树中随机启动根节点？

、、、

我刚开始学习决策树。所以这些问题可能有点傻。选择根节点的想法有点混乱。为什么我们不能随机选择根节点？唯一的不同似乎是，它将使决策树更长和更复杂，但最终会得到同样的结果。同样，作为决策树中特征选择过程的扩展，为什么不能使用像特征和目标之间的相关性这样简单的东西，或者用卡方检验来确定应该从哪一个特征开始呢？

浏览 11提问于2020-07-05得票数 1

回答已采纳

2回答

我是否可以使用其他不基于决策树的回归类型来像学习梯度增强的弱学习者一样使用它？

、、

我在想，如果我能像弱学习者一样在梯度提升中使用多项式回归，但我读到决策树是用来做这个的，我找不到其他弱学习者可以使用的可能性的东西。

浏览 0提问于2020-05-26得票数 2

1回答

ID3算法的改进

、、、

是否有任何方法可以修改ID3决策树构建算法，以在允许最多一个错误的情况下构建决策树。例如，如果有像这样的游戏，它会问问题，并根据答案输出一些类变量。我们可以容纳ID3算法中的最多一个错误吗谢谢

浏览 2提问于2013-10-25得票数 1

1回答

Orange3实现了什么决策树算法？

我只是想知道orange3在树小部件中实现了什么决策树算法？它部署的纯度是多少？

浏览 0提问于2019-06-16得票数 1

1回答

遗传算法:支持向量机/朴素贝叶斯的连接

、、、

我发现了以下七个分类器的列表：线性分类器: Logistic回归，朴素贝叶斯分类器最近邻支持向量机决策树升华树随机林神经网络什么是遗传算法，为什么它们不被认为是七个分类器的一部分？

浏览 0提问于2019-10-26得票数 0

回答已采纳

1回答

AdaBoost算法会遍历什么？

、、、

我正在尝试实现AdaBoost算法，并将决策树桩作为弱学习器，尽管我不能完全理解此算法的结构。我正在学习维基百科页面上的算法- 由于算法是迭代的，我们从't in 1...T‘开始迭代，但是这个T到底是什么呢？它是数据集中样本的总数，还是可以拆分决策树桩的可能特征的数量？如果这是样本的数量，那么这是否意味着我们可能会在多个弱学习者中对相同的特征进行分裂？或者，加权数据样本的方法会阻止这种情况的发生吗？

浏览 4提问于2018-03-20得票数 0

9回答