Python决策树分类_Python决策树分类算法_决策树分类 - 腾讯云开发者社区

、、、、

我正在做一个机器学习(数据挖掘)项目，我完成了数据探索和数据准备步骤，它是用python完成的！现在我要面对这个问题:我的数据集中有分类属性。经过研究，我发现对这类数据最合适的算法是一个决策树或一个随机forrest分类器！但我读过一些关于决策树和分类属性的类似问题，发现我使用的库(scikit-learn)不适用于分类属性。检查和，为了使其与分类一起工作，我需要将我的分类变量编码成数字变量，但我不想使用编码，因为我将根据答案松散属性的一些属性和一些信息，而且我的一些属性有超过100个不同的值。所以我想知道：有没有其他python库可以使用分类数据构建决策树而不进行任何编码？

浏览 0提问于2017-07-18得票数 1

回答已采纳

1回答

我们能从学习梯度增强决策树中提取最终的决策规则吗？

、、、、

我必须使用梯度引导决策树在Python中构建一个分类模型，并获得模型参数(节点处的值)以在硬件上实现。据我所知，梯度增强决策树的最终结果是一个具有阈值的普通决策树分类器，用于对输入数据进行分类。我读过以下文章：正如他们提到的， model.estimators_包含模型所包含的所有单个分类器。对于GradientBoostingClassifier，这是一个带有形状的二维numpy数组(n_estimators，n_classes)，每个项都是一个DecisionTreeRegressor。在建立梯度决策树分类器的过程中，给出了作为估计器的每个决策树的阈值获取方法。我不确定m

浏览 0提问于2019-04-23得票数 0

回答已采纳

2回答

scikit-learn默认使用哪种决策树算法？

、

有几种算法可以构建决策树，例如CART (分类和回归树)、ID3 (迭代二叉树3)等 scikit-learn默认使用哪种决策树算法？当我查看一些决策树python脚本时，它使用fit和predict函数神奇地生成结果。 scikit-learn会根据数据聪明地选择最好的决策树算法吗？

浏览 25提问于2019-08-21得票数 2

回答已采纳

1回答

决策树分类器如何在全局约束下工作？

、、、、

我用Python生成了一个使用sklearn的决策树分类器，该分类器在准确性方面运行良好。我用线性规划的最优解训练分类器，它将项目的最优分配返回给类，同时考虑全局成本约束(即将项目1分配给A类，代价为x。所有项目和类的总结果成本需要小于y值)。在使用分类器对所有项目进行重新分类后，虽然分类精度是可以接受的，但在大多数分类运行过程中都违反了全局成本约束。当然，因为python中sklearn中的标准决策树不考虑约束。是否有方法将classification？之后的全局约束合并为？在下一次作业选择时，是否有办法强迫树考虑所有已经分类的项目？我认为这需要建立某种成本或惩罚函数，以便在树的分类过程

浏览 1提问于2019-01-19得票数 2

回答已采纳

1回答

预编译Python脚本并将其包含在另一个Python程序中

、、

我一直在使用Python中的决策树分类器执行一个学习算法。 from sklearn.tree import DecisionTreeClassifier clf = DecisionTreeClassifier() clf.fit(train, train_label) predicted_label = clf.predict(test) 决策树分类器接受来自大型文本文件的培训标签。我想运行程序，而不再次执行培训过程。我将如何在Python中做到这一点？我将如何包括一个预编译的学习模型，并将其用于其他程序的测试？预编译的python文件与它有任何关系吗？

浏览 0提问于2018-03-02得票数 1

回答已采纳

3回答

Tensorflow支持决策树分类器吗？

、、、、

我试图实现决策树分类器来分类我的数据集。我正在使用Python。现在在scikit学习中很容易实现，但是我如何在tensorflow中实现这一点。

浏览 0提问于2018-02-20得票数 10

回答已采纳

1回答

分类和回归决策树是如何工作的？

、

我是初学者，正在学习数据科学。我可以知道分类和回归决策树是如何工作的吗？我想知道决策树是如何从分类到投影计算的。(例如，投影是基于特定组的模式吗？)(分类决策树)；它是特定组的平均值吗？(回归决策树) 我想知道决策树背后的理论。谢谢

浏览 1提问于2018-01-18得票数 1

回答已采纳

1回答

韦卡能做什么?巨蟒和滑雪者不能做什么？

、、

我想建立各种分类和回归决策树。我的用例集中于决策规则的提取和交流。以前，weka在我的组织中被用于决策树学习。weka可以做Python或Sklearn不能做的事情吗？我目前使用熊猫，小熊，枕木，和sk-学习和其他图书馆为我的工作流程。

浏览 0提问于2020-07-03得票数 2

2回答

有没有办法在python中使用Weka中的.model文件？

、、、

我目前正在使用Weka 3.8来制作一个决策树算法，以便正确地对句子进行分类。我想知道有没有什么办法可以使用python中的.model文件作为我发现的不能与Python3一起工作的包装器，或者使用Weka的不稳定版本。如果根本不可能在python中使用，有没有什么python库可以用字符串构建一个好的决策树？任何帮助都是非常感谢的。

浏览 2提问于2020-11-11得票数 0

1回答

如何寻找随机森林树/决策树的特征？

、

我正在使用python创建一个决策树分类器。我想要查看我在分类器中使用的功能名称。以下是代码 In [3]: my_forest.feature_importances_ Out[3]: array([ 0.09546647, 0.210264 , 0.31768782, 0.24191602, 0.05580487, 0.04318897, 0.03567185]) 我可以找到7个特征，但名称没有显示。

浏览 7提问于2017-02-06得票数 0

2回答

决策树中的下一个最佳预测

、、、、

我使用决策树分类器来预测基于以下数据选择的块。 📷 我能够预测基于数据的“块选择”列。怎样才能得到第二好，第三最好的预测等等(我需要一个有序的列表)？我能用决策树得到这个吗？或者我应该使用不同的模型？对于如何使用python学习这一点，有什么想法吗？

浏览 0提问于2018-05-10得票数 0

回答已采纳

1回答

决策树:分类概率分布？

、、、

我使用Weka的J48 (C4.5)决策树分类器。一般来说，对于决策树，当你击中一片叶子时，能不能确定一个分类概率分布？我知道在朴素贝叶斯中，每一次分类尝试都会产生一个分类分布。如果可以使用决策树，这种功能在Weka J48树中可用吗？我也可以尝试实现我自己的树。

浏览 3提问于2012-08-07得票数 3

2回答

增量决策树C++实现

、、

是否有人知道决策树分类器的增量实现。根据现有的决策树分类器，在训练集中加入新的实例，计算量小，速度快，从而生成最优决策树分类器。换句话说，我有一个集A的最优决策树分类器，名为T_1，现在我想添加实例X来设置A，并通过利用<code>E 110</代码>T_1</代码>E 211</代码>和<代码>E 112</代码>X</代码>E 213/代码>为集合<代码>E 114</代码>{A，X}</代码>{A，X}</代码>E 215</代码>找到最

浏览 5提问于2010-08-05得票数 3

回答已采纳

1回答

基于sklearn的决策树分类器的100%准确率

、、、

我正在使用sklearn的决策树分类器，但是我得到了100%的分数，我不知道出了什么问题。我已经测试了svm和knn，两者的准确率都在60%到80%之间，看起来也不错。这是我的代码： from sklearn.tree import DecisionTreeClassifier maxScore = 0 index = 0 Depths = [1, 5, 10, 20, 40] for i,d in enumerate(Depths): clf1 = DecisionTreeClassifier(max_depth=d)

浏览 2提问于2020-07-02得票数 0

回答已采纳

1回答

应用一个热编码器后，如何改变决策树的特征阈值？

、、、

我的dataframe中有一些字符串(女性x，男性，区域等等)，我想要匹配一个决策树。因此，我在所有这些分类特性中应用了一个热编码器--它返回了一堆带有0和1的新列。然而，决策树中特征阈值的缺省值为0.5。对于这些分类列来说，这是没有意义的。，有人知道如何在python?中一次更改许多列的阈值(不必输入每个列的名称)吗？我想要这样的东西:在计算统计数据(AUC，ROC，ACC等)之前，我想做的是:列女性分裂为0和1。 ps:我也有一些数字数据(例如收入)，所以我不能更改所有列ps2的阈值:分类1和0在列6到30中。

浏览 1提问于2020-10-17得票数 0

1回答

在研究中可以把套袋法作为决策树的改进技术吗？

、、、

套袋采用决策树作为分类器。在解决问题过度拟合问题的研究中，我希望以决策树(c4.5)作为改进决策树(c4.5)的方法。这有可能是因为一些讲师说不对，因为套袋，其他分类器不是混合的两种？

浏览 0提问于2020-09-21得票数 2

回答已采纳

1回答

如何在科学知识学习决策树中进行多标签分类？

、、、

我有一个问题，分类输入有多个标签。因此，问题是多标签分类。我使用了scikit--学习决策树分类器来完成这个任务，并且在初始阶段给出了很好的结果。但是，我想知道它是如何在引擎盖下工作的，以及如何在决策树中进行多标签分类？重要的问题是如何使用两个不同类别的标签同时训练一个曾经初始化过的模型？决策树模型将如何解决两组不同标签的优化任务？

浏览 1提问于2019-09-03得票数 0

1回答

存储决策树代码/算法

、、

我有一个作业，我计划使用机器学习(特别是监督学习，比如决策树)。最终的代码将在教学助理的pc上运行，该pc没有安装scikit learn或其他外部库。因此，我需要从头开始编写决策树分类器之类的东西，或者在本地使用外部库，并存储最终的算法。总而言之:当给定一组标记的训练数据时，如何在python代码中存储最终算法，而不依赖外部库在未来运行最终算法？例如，决策树可以分解为一系列if/then语句，我想生成这些if/then语句并存储它们，这样它就可以在除了python之外什么都没有安装的计算机上运行。关于如何实现这一点，最好的建议是什么？如果这是在错误的论坛，请告知。

浏览 0提问于2015-03-10得票数 0

8回答

将分类数据传递给Sklearn决策树

、、

有几篇关于如何将分类数据编码到Sklearn决策树的文章，但是从Sklearn文档中，我们得到了以下内容决策树的一些优点是： (...) 能够处理数字和分类数据。其他技术通常专门用于分析只有一种类型变量的数据集。有关更多信息，请参见算法。但是运行以下脚本 import pandas as pd from sklearn.tree import DecisionTreeClassifier data = pd.DataFrame() data['A'] = ['a','a','b','a'] data

浏览 10提问于2016-06-29得票数 102

回答已采纳

2回答

星火Scala替代机器学习库？

、、、

我使用Spark进行多类分类，并且特性是连续的。对于这类分类，MLlib似乎仅限于决策树和随机森林--对于Na、多项式和Bernoulli，我需要使用高斯，而LogisticRegressionWithLBFGS也不合适。我知道在Python中，您可以将sci学习与Spark集成在一起，但是在使用Scala时有什么选择吗？想听听人们对此的想法。

浏览 0提问于2016-05-27得票数 2

1回答

决策树与Logistic回归相结合

、、、、

基本上，我的问题与下面的论文有关(只阅读1.Introduction、3.Prediction model structure和3.1 Decision tree feature transforms部分的开头部分就足够了，其他的内容都可以跳过) 本文认为，在组合决策树+线性分类(如logistic回归)的情况下，与仅使用决策树或线性分类(而不是两者兼用)相比，二进制分类具有更好的性能。简单地说，我们有几个决策树(简单地假设两棵树，三个叶节点的第一棵树，两个叶节点的第二棵树)和一些实值特征向量x，它作为所有决策树的输入。所以, 如果第一棵树的决策为leaf node 1，第二树的决策

浏览 6提问于2017-01-17得票数 1

1回答

对于不同的优化度量，决策树的构建有何不同？

、、、

我理解如何使用诸如熵、基尼指数和方差减少等准则构造决策树(在ID3算法中)。但是这些标准的公式并不关心诸如准确性、召回、AUC、kappa、f1分数等优化指标。 R和Python包允许我在构建决策树时对这些度量进行优化。他们对这些指标中的每一个都有什么不同？变化在哪里发生？对于不同的分类/回归算法，这些变化是否有一个模式？

浏览 0提问于2020-03-13得票数 1

1回答

带有Adaboost的决策树/树桩

、、

我刚开始与Adaboost一起学习决策树，并在OpenCV上试用，并有一些问题。增强决策树我知道，当我使用Adaboost与决策树，我不断地拟合决策树，以重新加权版本的培训数据。分类以加权多数票进行。当使用Adaboost训练决策树时，我可以使用引导吗？也就是说，我们选择数据集的子集，并在每个子集上训练一棵树，然后将分类器输入Adaboost。增强决策桩我是否对决策桩使用同样的技术？或者我可以创建与功能数量相等的树桩吗？也就是说，如果我有两个有10个特性的类，在将分类器输入Adaboost之前，我会为每个特性总共创建10个决策集。

浏览 8提问于2016-08-08得票数 1

回答已采纳

1回答

如果验证数据集有一个新的类别，那么机器学习技术(特别是决策Tress和Logistic回归)会发生什么？

、、、、

假设我有一个数据集，它有一个分类变量，而我正在解决的问题是分类问题。这个分类变量var将“”，“B”，“C”作为可能的数据集。如果一个新的类别'D‘只出现在验证数据集中(意思是:绝对是新的数据)，那么决策树会发生什么？假设变量var是树中使用的特性。带有决策树的：会出错吗？决策树停止路径并返回非最终节点的概率？ Logistic回归的：所有类别的虚拟变量为零(我猜想)，然后模型正常运行吗？

浏览 0提问于2019-04-12得票数 1

回答已采纳

1回答

如何用滑雪板决策树代替糟糕的选择

、、

我使用sklearn决策树将文档分类为"type1“和"type2”两种可能的类型。我已经分离出几个似乎相关的特性，并尝试手动组合它们来评估模型的结果。在手动对文档进行分类时，我使用以下结果： 1型 2型未知然后，我给一个决策树同样的特征。在这种情况下，结果会更糟，因为它总是尝试将文档分类为"type1“或"type2”的类别之一，但无法将文档分类为“未知”。是否有可能以一种在高度不确定性的情况下不会对文档进行分类而不是选择可能出错的类别的方式来配置sklearn决策树？

浏览 0提问于2018-11-29得票数 3

回答已采纳

2回答

决策树是试图最大化信息获取还是熵？

、、、

据我所知，决策树试图将高熵的分类器放在决策树上。然而，信息的获取是如何发挥作用的呢？信息增益被定义为： InformationGain = EntropyBefore - EntropyAfter 决策树是否试图将信息增益较低的分类器放置在树的顶部？那么，熵总是最大化，信息增益总是最小化吗？对不起，我只是有点糊涂。谢谢!

浏览 1提问于2013-12-19得票数 6

1回答

元随机森林分类器是如何确定最终分类的？

、、

我正试图确切地了解元随机森林分类器是如何确定最终预测的，我知道存在一个投票系统，并且使用决策树的聚合来找到最终的预测，我从这里读到：Python中的随机森林分类：随机森林是一种集合决策树算法，因为在回归问题中，最终预测是每个决策树预测的平均值；在分类中，它是最频繁的预测的平均值我阅读了RFC源代码：合奏/森林：输入样本的预测类别是森林中树木的投票，按其概率估计进行加权。也就是说，预测类别是平均概率估计值最高的一类。这是否意味着，例如： 📷 我们有3类(A，B，C)的估计器，每棵树都有一定数量的最终叶节点，并有一个类预测； A类、B类或C类的概率是叶节点预测A类的次数的结果，即Tree1

浏览 0提问于2019-04-30得票数 5

回答已采纳

2回答

为什么连续特征在决策树模型中比分类特征更重要？

、、、、

我的预测模型中既有分类特征，也有连续特征，我希望选择(和排序)最重要的特征。我使用一个热编码将所有的分类变量转换为虚拟变量(为了更好地解释我的logistic回归模型)。一方面，我使用LogisticRegression (sklearn)，并通过使用它们的系数对最重要的特征进行排序。通过这种方式，我将分类变量和连续变量都视为最重要的特性。另一方面，当我想使用决策树模型(SelectFromModel)对特征进行排序时，他们总是先给连续的特征排序(feature_importances_)，然后给出分类(虚拟)变量。与Logistic回归完全不同的行为。虽然决策树模型的性能远高于Log

浏览 0提问于2020-01-15得票数 9

回答已采纳

2回答

决策树中的序数特征

我很好奇序数特征是否与决策树中的分类特征不同，我对目标是绝对或连续的两种情况都感兴趣。如果有不同之处，你能指出好的源代码和任何支持它的软件包(R或Python)吗？

浏览 0提问于2016-09-15得票数 3

回答已采纳

1回答

为什么KNN比决策树快得多？

、、、

在一次面试中，我遇到了雇主的一个问题。他问我为什么KNN分类器比决策树快得多，例如在字母识别或人脸识别中？当时我完全不知道。所以我想知道我应该在哪些方面比较这两种分类方法的速度性能？谢谢。

浏览 0提问于2013-03-15得票数 8

回答已采纳

1回答

决策树-非常稀疏特征的预处理

、

如何为决策树的稀疏特性预处理数据？从这个决策树的Turi文档它提到这一点：为什么选择决策树？不同的型号有不同的优点。决策树模型非常擅长处理具有数值特征的表格数据，或少于数百个类别的分类特征。与线性模型不同，决策树能够捕捉特征与目标之间的非线性交互.一个重要的注意事项是，基于树的模型的设计并不是为了处理非常稀疏的特性。当处理稀疏输入数据(例如大维分类特征)时，我们可以对稀疏特征进行预处理以生成数值统计数据，也可以切换到更适合这种情况的线性模型。如果我们有一个非常稀疏的分类列(许多0's)，那么对于这个类别，我们可以对每一行转换什么类型的数字统计？

浏览 0提问于2019-03-07得票数 2

1回答

用make_classification在Python中进行数据仿真

、、、

关于Python中的数据模拟，我有一个问题。本文对不平衡数据的分类进行了研究，并对不同方法在模拟数据上的有效性进行了测试。我在各种文章和书籍中看到，make_classification函数用于生成数据。然后从正态分布产生数据，因此数据是连续的，而不是离散的。这类数据对分类(SVM，决策树)研究是否正确？

浏览 0提问于2021-05-03得票数 0

1回答

决策树桩

、、、、

我想使用AdaBoost实现一个java应用程序，它可以对大象是非洲象还是亚洲象进行分类。我的Elephant类有字段： int size; int weight; double sampleWeight; ElephantType type; // (which can be Asian or African). 我是AdaBoost的新手，我了解到好的弱分类器是决策树桩。我想知道是否支持我只创建两个决策树桩(一个用于大小，一个用于重量)，或者我是否应该创建更多的决策树桩(几个不同的大小和几个不同的重量)？分类器的创建到底是什么样子的？

浏览 4提问于2012-08-25得票数 2

回答已采纳

1回答

分类数据是/不是0/1 python -这是一种正确的方法吗？

、、、、

我的数据集有几个带有yes/no (分类数据)的特征。在python中，我使用的机器学习算法中很少有不直接处理分类数据的。我知道如何将yes/no转换为0/1，但我的问题是-这是一种正确的方法吗？这些从no/yes到0/1的值会被算法曲解吗？我计划对我的数据集使用的算法是决策树(DT)、随机森林(RF)和神经网络(NN)。

浏览 0提问于2018-03-12得票数 1

1回答

什么时候基于规则的分类器优于决策树？

、、、

假设我可以在决策树和基于规则的分类器之间做出选择，我应该选择哪一个？假设基于规则的分类器具有相互排斥和详尽的规则集，那么哪一种更可取？基于规则的分类器是否有一些特定的优点/缺点来帮助我们决定它是否比决策树更可取？

浏览 1提问于2015-03-13得票数 0

回答已采纳

1回答

决策树的剪枝与参数约简

、、、

我试图使用决策树分类器来执行分类。我想知道使用特征约简方法是否与决策树相关，因为它们会自动地使用剪枝？我的想法是从5到15参数进行一个循环，然后比较每个决策树的分类精度，然后得出我分类的最优参数数。谢谢。

浏览 0提问于2016-06-24得票数 1

回答已采纳

4回答

我应该使用决策树或逻辑回归来进行分类吗？

、、

我正在研究一个分类问题。我有一个包含相同数量的分类变量和连续变量的数据集。如何在决策树和逻辑回归之间决定使用哪种技术？假设logistic回归更适合连续变量，决策树更适合连续变量和范畴变量，这是否正确？

浏览 0提问于2015-06-09得票数 17

回答已采纳

1回答

如何计算决策树的AUC？

、

假设我有一个只有一个连续变量的数据集，我尝试使用决策树算法来构建一个模型，该模型从数据集中对+ve和-ve标签进行分类。我运行10折交叉验证。如何计算决策树分类器的AUC？算法会检查分类器的不同阈值，并确定AUC吗？如果我有两个以上的连续变量呢？谢谢!

浏览 5提问于2014-03-12得票数 1

1回答

利用多级列的分类模型.层次信息

、、、、

我正在寻找一些健壮的分类/聚类模型，例如决策树，它将使用数据集中的层次信息。数据集由唯一的行(客户ID)和购买的产品(列)组成。这些列是三级的，层次结构是-类产品产品类型.。例如->‘卧室’(类)-‘床’(产品)-‘特大床’(产品类型)。表的价值是计数，也就是说，它们表示所涉客户是否购买了一张特大床和多少张。我正在寻找一些分类模型，它首先根据“产品类别”对客户进行分类，然后根据“产品”，然后根据“产品类型”对客户进行分类。也许，我在寻找分类方法中的一些分类。有这样的东西可用吗?最好是在Python中？

浏览 3提问于2022-01-19得票数 0

2回答

决策树:冲刺对SLIQ？

、

我发现了不同类型的决策树，例如SPRINT和SLIQ方法。这两种方法都用于解决分类问题，使用Gini索引进行特征选择并遵循步骤(根据幻灯片8上的这 )：开始对样本进行预分类。只要没有达到停止标准:对于每个属性:将所有节点放置到类直方图中，并开始对拆分进行评估。选择一个分裂。更新决策树；对于每个新节点，更新其类列表(节点)。所以，我的问题是: SPRINT算法和SLIQ算法有什么区别？

浏览 0提问于2022-03-29得票数 1

回答已采纳

1回答

具有输出分类和回归的多输出决策树

、、、、

我正在进行一个项目，并希望使用决策树(因为我的输入中有猫值和数值，并且不想转换分类变量)来预测输出变量，但问题是我没有一个输出变量，而是4个！ 📷 该图片是我的输出数据集的外观：第一个问题可以用回归决策树进行预测。其余的如果可以用分类决策树来预测，但是有两个以上的类，所以是多类的。所以我想知道什么是解决这个问题的最好办法：使用4个不同的决策树，每个变量一棵树？还是使用一个多输出决策树？每种方法的优点和不便是什么？

浏览 0提问于2017-07-18得票数 0

1回答

Adaboost和决策树的重要性有何不同？

、、、

我有一个多类分类问题，我在杂质减少的基础上提取特征重要性。我比较了一个决策树和AdaBoost分类器，我认为有一个功能在决策树的顶部，而根据AdaBoost，它的重要性要低得多。这是正常的行为吗？谢谢

浏览 6提问于2022-04-19得票数 0

1回答

Catboost回归者如何在预测时间处理分类特征？

、、、

我理解Catboost回归器在训练时使用基于目标的编码将分类特征转换为数字特征。但是在标签完全未知的时候，Catboost是如何处理分类特征的呢？如果决策树期望将分类特征值作为数字来看待，那么在预测时间内，一个对象如何沿着Catboost决策树下降？我试着查看正式文档，但只有在培训期间，当标签可用时，才能找到编码。

浏览 0提问于2022-06-29得票数 0

回答已采纳

1回答

将决策树拟合为梯度提升树的可理解性

、、、

我想知道是否有文献或有人可以解释如何将决策树与梯度增强树分类器相匹配，以获得更多可解释的结果。这显然是Turi在其解释函数中使用的方法，它输出如下内容：图里的解释功能： 📷 从他们的页面这里。我知道，对于随机森林，您可以像TreeInterpreter python包中所看到的那样，平均每个树中每个特性的贡献，但这似乎是一种不同的方法，因为它关注的是精确的拆分和一个决策树。有没有人对这种解释坡度增强树的方法有更多的了解？

浏览 0提问于2016-08-08得票数 4

3回答

为什么随机森林是决策树的一种改进？

、

假设我们有一个二进制分类问题，我们在数据集上构建了一个决策树。假设我们有5个特征，那么决策树将在第一步中选择最优的特征，并在这个特征上选择最佳的阈值来分割数据集，然后继续使树更深。best的定义是分类误差最小的。我的问题是:既然决策树在每一步都会选择最佳的特征来分割，那么为什么随机森林(也就是许多决策树)是对决策树的改进？一个决策树不就足够了吗？更新我的意思是:如果你有一个decision tree classifier和一个参数相同的random forest classifier (max_depth，number of children等)，那么decision tree cla

浏览 0提问于2019-05-01得票数 2

1回答

如何组合两个决策树对象？

、、、

我已经从随机森林分类器中选择了一些决策树对象(使用估计器)。现在，我想将所选的决策树对象合并为一个对象。有人可以建议我如何合并随机林中选定的决策树对象吗？

浏览 17提问于2019-03-27得票数 0

回答已采纳

1回答

自动分类模型选择

、、、

我想知道有什么方法可以让计算机决定使用哪种分类模型(决策树、逻辑回归、KNN等)。只需查看训练数据。即使是数学也是非常有帮助的。我将用python 3编写这篇文章，所以如果scikit-learn或tensorflow中有任何用于此目的的构建方法，它将会非常有帮助。

浏览 1提问于2018-03-15得票数 2

1回答

具有可变输出数的Python决策树

、、

我希望使用Python 库来设置一个SciKit。然而，我面临的问题是，它不是一个简单的"n_outputs“分类。一些样本将有3个输出，一些4，一些5。我不知道最好的方法是把它传递给库。我正在考虑使用输出的最大数量，并进行“无输出”分类。因此，如果我训练一个集，其中每一个样本被强制到5个输出，任何样本原本只有3个分类将改为5通过添加“无输出”分类。你觉得这样行吗？还有其他方法来实现多输出决策树的可变输出数吗？

浏览 3提问于2015-05-19得票数 2

回答已采纳

1回答

机器学习中集成方法/决策树的决策边界是如何生成的？

、、

决策树的工作原理是在每个节点上拆分训练子集，遍历根到叶节点，直到我们得到分类/回归结果。但是实际的决策边界(权重)是如何计算的呢？我们使用成本函数在每个节点上执行拆分。这个代价函数也能帮助我们找到权重吗？例如，为了构建AdaBoost分类器，训练第一个基本分类器(例如决策树)，并使用该分类器对训练集进行预测。然后增加错误分类的训练实例的相对权重。第二个分类器使用更新的权重进行训练，并再次对训练集进行预测，更新权重，依此类推。这个相对权重是如何计算的？

浏览 45提问于2019-04-14得票数 1

1回答

机器学习分类器的不同用法

、

我已经学习了机器学习中的几种分类器-决策树，神经网络，支持向量机，贝叶斯分类器，K-NN等。谁能帮助我理解什么时候我应该更喜欢其中一个分类器-例如-在哪种情况下(数据集的性质等)我应该更喜欢决策树而不是神经网络，或者哪种情况支持向量机可能比贝叶斯更好？如果这里不是发布这个问题的好地方，很抱歉。谢谢。

浏览 0提问于2013-07-12得票数 0