分类决策树中的学习曲线是什么意思？

学习曲线是分类决策树中的一个概念，它表示了模型在训练过程中的学习进展情况。学习曲线通常以训练样本数量为横轴，模型性能指标（如准确率或误差）为纵轴，绘制出模型在不同训练样本数量下的性能变化趋势。

学习曲线可以帮助我们评估模型的训练情况和泛化能力。通常情况下，当训练样本数量较少时，模型可能会过拟合，即在训练集上表现良好但在测试集上表现较差。这时学习曲线会显示出训练集和测试集的性能差距较大。随着训练样本数量的增加，模型逐渐学习到更多的模式和规律，性能逐渐提升，同时训练集和测试集的性能差距也逐渐减小。当训练样本数量足够多时，模型的性能趋于稳定，学习曲线会趋于平稳。

通过观察学习曲线，我们可以判断模型是否存在欠拟合或过拟合的问题。如果学习曲线显示出训练集和测试集的性能都较低，且两者之间的差距较小，可能是模型欠拟合，需要增加模型复杂度或改进特征工程。如果学习曲线显示出训练集的性能较好而测试集的性能较差，且两者之间的差距较大，可能是模型过拟合，需要增加训练样本数量、减少模型复杂度或采用正则化等方法来解决过拟合问题。

腾讯云提供了一系列与机器学习和数据分析相关的产品和服务，例如腾讯云机器学习平台（https://cloud.tencent.com/product/tcmlp）、腾讯云数据湖分析服务（https://cloud.tencent.com/product/dla）、腾讯云人工智能开放平台（https://cloud.tencent.com/product/aiopen）、腾讯云数据仓库（https://cloud.tencent.com/product/dw）、腾讯云大数据分析平台（https://cloud.tencent.com/product/dcap）等，可以帮助用户进行机器学习和数据分析任务，包括分类决策树中的学习曲线分析。

页面内容是否对你有帮助？

有帮助

没帮助

在相同数据或不同数据中进行测试和训练

、、

我有两个类别的数据集，我用来分类它的朴素贝叶斯分类器。首先:在我得到的相同数据中训练和测试分类器： Accuracy: 71.1262 False negative rate: FN/FN+TP = FN/P= 284/295 = 0.840 False positive rate: FP/FP+TN = FP/N = 93/886 = 0.104 Sensitivity: Recall:True positive rate: TP/TP+FN = TP/P = 0.1593 Specificity: True negative rate: TN/TN+FP = TN/N = 0.

浏览 20提问于2016-09-03得票数 0

1回答

一种热编码关联和决策树

、、、

关于为学习准备数据，我有几个问题。当我想要使用for相关性和分类器决策树时，我对如何将列转换为分类列和二进制列感到非常困惑。对于NBA_df中的示例，可以使用决策树将position列转换为分类列，是否可以使用.astype('category').cat.codes将其转换为分类列？(我知道在篮球比赛中，你可以用数字1-5来表示位置。NBA_df 在students_df中，为什么使用.get_dummies将“性别”、“种族/民族”、“午餐”、“考试准备课程”列转换为新的二进制列而不是在同一列中进行分类转换会更正确？students_df 它在相关性和树上是一样的吗？

浏览 11提问于2021-06-16得票数 0

1回答

解释目标编码后的决策树结果

、

我不知道如何解释我的决策树的结果后，我使用了目标编码，有人能澄清吗？下面的例子不需要目标编码来解释我在这里的困惑。举个例子，我试着把一种水果是腐烂的还是没有腐烂的，按照它的年龄和水果类型来分类。我对水果列使用目标编码： 📷 然后，我得到以下具有默认sklearn决策树分类器参数的决策树： 📷 我相信编码后，我丢失了有关水果类型的信息，我只能说，如果fruit_target <= 0.841，那么水果如果更小，就会腐烂，否则就不会腐烂。但是我怎么解释0.841，这是什么意思？

浏览 0提问于2020-09-12得票数 1

回答已采纳

1回答

决策树桩

、、、、

我想使用AdaBoost实现一个java应用程序，它可以对大象是非洲象还是亚洲象进行分类。我的Elephant类有字段： int size; int weight; double sampleWeight; ElephantType type; // (which can be Asian or African). 我是AdaBoost的新手，我了解到好的弱分类器是决策树桩。我想知道是否支持我只创建两个决策树桩(一个用于大小，一个用于重量)，或者我是否应该创建更多的决策树桩(几个不同的大小和几个不同的重量)？分类器的创建到底是什么样子的？

浏览 4提问于2012-08-25得票数 2

回答已采纳

1回答

具有输出分类和回归的多输出决策树

、、、、

我正在进行一个项目，并希望使用决策树(因为我的输入中有猫值和数值，并且不想转换分类变量)来预测输出变量，但问题是我没有一个输出变量，而是4个！ 📷 该图片是我的输出数据集的外观：第一个问题可以用回归决策树进行预测。其余的如果可以用分类决策树来预测，但是有两个以上的类，所以是多类的。所以我想知道什么是解决这个问题的最好办法：使用4个不同的决策树，每个变量一棵树？还是使用一个多输出决策树？每种方法的优点和不便是什么？

浏览 0提问于2017-07-18得票数 0

2回答

决策树中的多元分类是什么？

、、

我是新领域的人工智能和阅读有关决策树。我指的是AIMA的书，这几乎是标准的介绍人工智能书推荐。在关于决策树的章节中，他们在书中讨论了一个案例，在第一个属性分裂之后，没有剩下的属性，但正负两个例子仍然没有分开，这意味着这些例子具有完全相同的描述.他们建议的解决方案是“返回剩余示例的多个分类”。我在想，那部分黑体字是什么意思？返回一组示例的“多元分类”是什么意思？

浏览 3提问于2013-03-26得票数 10

回答已采纳

1回答

在XGBClassifier中‘objective’=‘binary:logitraw’是什么？

、、、、

对于使用XGBoost的分类任务，我知道参数‘objective’=‘binary :logistic’表示使用概率使用目标函数指定二进制分类任务。根据我的理解，这里的概率只是计算决策树的每个叶子中的正类实例。那么参数‘objective’=‘binary:logitraw’做什么呢？这里的文档(https://xgboost.readthedocs.io/en/latest/parameter.html)指出这意味着“二分类的逻辑回归，逻辑转换之前的输出分数”。“逻辑回归之前的输出得分”是什么意思，特别是因为这里的概率是在计算决策树的每个叶子中的正类实例，所以对我来说没有意义，这将涉及到

浏览 216提问于2020-09-05得票数 2

1回答

分类和回归决策树是如何工作的？

、

我是初学者，正在学习数据科学。我可以知道分类和回归决策树是如何工作的吗？我想知道决策树是如何从分类到投影计算的。(例如，投影是基于特定组的模式吗？)(分类决策树)；它是特定组的平均值吗？(回归决策树) 我想知道决策树背后的理论。谢谢

浏览 1提问于2018-01-18得票数 1

回答已采纳

1回答

我们能从学习梯度增强决策树中提取最终的决策规则吗？

、、、、

我必须使用梯度引导决策树在Python中构建一个分类模型，并获得模型参数(节点处的值)以在硬件上实现。据我所知，梯度增强决策树的最终结果是一个具有阈值的普通决策树分类器，用于对输入数据进行分类。我读过以下文章：正如他们提到的， model.estimators_包含模型所包含的所有单个分类器。对于GradientBoostingClassifier，这是一个带有形状的二维numpy数组(n_estimators，n_classes)，每个项都是一个DecisionTreeRegressor。在建立梯度决策树分类器的过程中，给出了作为估计器的每个决策树的阈值获取方法。我不确定m

浏览 0提问于2019-04-23得票数 0

回答已采纳

1回答

决策树:分类概率分布？

、、、

我使用Weka的J48 (C4.5)决策树分类器。一般来说，对于决策树，当你击中一片叶子时，能不能确定一个分类概率分布？我知道在朴素贝叶斯中，每一次分类尝试都会产生一个分类分布。如果可以使用决策树，这种功能在Weka J48树中可用吗？我也可以尝试实现我自己的树。

浏览 3提问于2012-08-07得票数 3

2回答

分类决策树中的学习曲线是什么意思？

、

我在分析中使用了分类决策树。首先，我将整个数据分为训练和测试- 60%:40%。然后我在我的训练集上使用GridSearch来获得最佳得分模型(max_depth=7)。然后在交叉验证集和训练集上绘制学习曲线。这是我得到的图表。似乎有两条线是重叠的。那么它告诉我什么呢？在我的模型中没有过度拟合？总的来说，为什么我们在分析中需要学习曲线？ Link to my learning curve image 非常感谢!

浏览 67提问于2019-02-11得票数 1

1回答

使用决策树比较scikit学习聚类

、、、

我正在为一个类做一个项目，我从LIBSVM中获取一些数据，并通过两种不同的聚类算法运行它。我有我的kmeans生成8个集群，而我的凝聚体是将它们分组为3个集群。现在，我正在尝试告诉我的kmeans生成的集群标签是否可以用于预测我的聚集式集群生成的集群标签，例如，将集群#6中的所有实例从agg集群映射到cluster#1。我的教授建议使用决策树分类器，但我不太确定如何做到这一点。我知道我会将agg聚类标签作为类标签，然后将我的数据输入其中，看看它是如何分类的。这就是我的问题所在，我有几个： 1) scikit学习决策树分类器输出是什么？它是每个实例可能被归类的概率列表吗？或者它是否明确地对每

浏览 3提问于2015-04-10得票数 3

2回答

增量决策树C++实现

、、

是否有人知道决策树分类器的增量实现。根据现有的决策树分类器，在训练集中加入新的实例，计算量小，速度快，从而生成最优决策树分类器。换句话说，我有一个集A的最优决策树分类器，名为T_1，现在我想添加实例X来设置A，并通过利用<code>E 110</代码>T_1</代码>E 211</代码>和<代码>E 112</代码>X</代码>E 213/代码>为集合<代码>E 114</代码>{A，X}</代码>{A，X}</代码>E 215</代码>找到最

浏览 5提问于2010-08-05得票数 3

回答已采纳

1回答

多级随机林

、

如果一个决策树分成两个类，那么随机林如何能够在分类中创建多个桶呢？你能张贴任何关于这个理论的链接吗？背后的理论是什么？

浏览 0提问于2018-01-31得票数 0

1回答

多类分类器

、、、

我正在使用MFCC功能处理一个音频多类分类问题(噪声，血管，2种动物)。我用不同的分类器得到了不同的结果。我尝试了贝叶斯类型，人工神经网络，MSVM和决策树。谁能告诉我这4个分类器的优缺点是什么？非常感谢

浏览 1提问于2015-05-10得票数 0

1回答

在研究中可以把套袋法作为决策树的改进技术吗？

、、、

套袋采用决策树作为分类器。在解决问题过度拟合问题的研究中，我希望以决策树(c4.5)作为改进决策树(c4.5)的方法。这有可能是因为一些讲师说不对，因为套袋，其他分类器不是混合的两种？

浏览 0提问于2020-09-21得票数 2

回答已采纳

2回答

滑雪决策树中分类自变量的处理

、、

我使用一位编码器将我所有的分类自变量从字符串转换为数字(二进制1和0)，但是当我运行决策树时，算法认为二进制分类变量是连续的。例如，如果性别是我的自变量之一，则将男性改为1，将女性转换为0。当我在决策树中使用这一点时，节点将在0.5处分裂，这是没有意义的。如何将此数字连续转换为数字范畴？

浏览 3提问于2020-02-04得票数 2

1回答

目标函数和xgboost模型有什么不同？

、、、

我知道GBtree使用决策树进行分类和回归，但是如何使用gblinear来解决分类问题呢？这不是给了我们一个连续的预测吗？我想我混淆了xgboost中的参数“助推器”和“目标函数”。 GBtree能给我们与GBLinear相比的什么？在xgboost中，“目标函数”和“助推器”的区别是什么？

浏览 0提问于2018-07-14得票数 0

1回答

如何查看回归树？

、、、

我想要可视化我的决策树应用于回归(只有这个分类图有效)，只显示值而不是构建的树本身的问题是什么？

浏览 0提问于2020-05-29得票数 1

2回答

如何处理C4.5 (J48)决策树中缺失的属性值？

、、、、

使用Weka的C4.5 (J48)决策树处理缺失的特性属性值的最佳方法是什么？在训练和分类过程中都会出现缺失值的问题。如果训练实例中缺少值，我是否正确地假设我放置了一个“？”功能的价值？假设我能够成功地构建决策树，然后从Weka的树结构中用C++或Java创建自己的树代码。在分类期间，如果我试图对一个新实例进行分类，那么对于缺少值的特性，我应该放什么值呢？我将如何下降树的决策节点，我有一个未知的值？使用朴素的贝叶斯会更好地处理缺失的值吗？我只会给他们分配一个很小的非零概率，对吧？

浏览 0提问于2012-11-16得票数 6

回答已采纳

1回答

为什么KNN比决策树快得多？

、、、

在一次面试中，我遇到了雇主的一个问题。他问我为什么KNN分类器比决策树快得多，例如在字母识别或人脸识别中？当时我完全不知道。所以我想知道我应该在哪些方面比较这两种分类方法的速度性能？谢谢。

浏览 0提问于2013-03-15得票数 8

回答已采纳

1回答

关于分类特性的特性重要性的查询

、、

关于分类特性的特性重要性的查询：上下文:我有几乎185个分类特性，这些分类特性有2、3、8、1或有时4类，null也是。我需要为我的模型选择前60个功能。我还了解到，需要根据业务重要性或通过随机森林/决策树选择特征重要性来选择特征。查询：我已经绘制了每个特征(价值计数与类别)的直方图来进行分析。选择功能是否重要的方法是什么？从分类数据中获得特征重要性，数据科学行业遵循的标准实践是什么？是否有基本和优雅的方式来选择最重要的特性？我如何设计这些分类特征？

浏览 0提问于2018-12-15得票数 1

1回答

决策树与Logistic回归相结合

、、、、

基本上，我的问题与下面的论文有关(只阅读1.Introduction、3.Prediction model structure和3.1 Decision tree feature transforms部分的开头部分就足够了，其他的内容都可以跳过) 本文认为，在组合决策树+线性分类(如logistic回归)的情况下，与仅使用决策树或线性分类(而不是两者兼用)相比，二进制分类具有更好的性能。简单地说，我们有几个决策树(简单地假设两棵树，三个叶节点的第一棵树，两个叶节点的第二棵树)和一些实值特征向量x，它作为所有决策树的输入。所以, 如果第一棵树的决策为leaf node 1，第二树的决策

浏览 6提问于2017-01-17得票数 1

1回答

基于sklearn的决策树分类器的100%准确率

、、、

我正在使用sklearn的决策树分类器，但是我得到了100%的分数，我不知道出了什么问题。我已经测试了svm和knn，两者的准确率都在60%到80%之间，看起来也不错。这是我的代码： from sklearn.tree import DecisionTreeClassifier maxScore = 0 index = 0 Depths = [1, 5, 10, 20, 40] for i,d in enumerate(Depths): clf1 = DecisionTreeClassifier(max_depth=d)

浏览 2提问于2020-07-02得票数 0

回答已采纳

1回答

如何选择拆分决策树的顺序？

、

我知道决策树沿着每个属性递归地分裂，贪婪地将错误的分类/偏差降到最小。但是，属性被拆分的顺序是什么呢？换句话说，对于N维的回归树，是什么决定了哪个属性首先被分割？

浏览 0提问于2015-10-01得票数 1

2回答

为什么连续特征在决策树模型中比分类特征更重要？

、、、、

我的预测模型中既有分类特征，也有连续特征，我希望选择(和排序)最重要的特征。我使用一个热编码将所有的分类变量转换为虚拟变量(为了更好地解释我的logistic回归模型)。一方面，我使用LogisticRegression (sklearn)，并通过使用它们的系数对最重要的特征进行排序。通过这种方式，我将分类变量和连续变量都视为最重要的特性。另一方面，当我想使用决策树模型(SelectFromModel)对特征进行排序时，他们总是先给连续的特征排序(feature_importances_)，然后给出分类(虚拟)变量。与Logistic回归完全不同的行为。虽然决策树模型的性能远高于Log

浏览 0提问于2020-01-15得票数 9

回答已采纳

1回答

在python中不进行编码的多类MultiOutput分类

、、、、

我正在做一个机器学习(数据挖掘)项目，我完成了数据探索和数据准备步骤，它是用python完成的！现在我要面对这个问题:我的数据集中有分类属性。经过研究，我发现对这类数据最合适的算法是一个决策树或一个随机forrest分类器！但我读过一些关于决策树和分类属性的类似问题，发现我使用的库(scikit-learn)不适用于分类属性。检查和，为了使其与分类一起工作，我需要将我的分类变量编码成数字变量，但我不想使用编码，因为我将根据答案松散属性的一些属性和一些信息，而且我的一些属性有超过100个不同的值。所以我想知道：有没有其他python库可以使用分类数据构建决策树而不进行任何编码？

浏览 0提问于2017-07-18得票数 1

回答已采纳

1回答

机器学习特征选择与时间序列相结合

、、、

我有时间序列预测和监督/无监督机器学习算法(聚类、分类、决策树等)方面的基本知识。我现在的任务是预测一堆股票价格。每只股票都有其先前的交易价格(18个月)以及其他一些特征:息票、资产评级、行业等。我只知道如何单独使用时间序列分析或监督机器学习，我不知道如何将两者结合在一起。有什么特殊的算法可以作为预测模型使用吗？将动态和静态信息结合在一起的步骤是什么？任何帮助都将不胜感激！

浏览 0提问于2023-03-02得票数 0

1回答

如何在科学知识学习决策树中进行多标签分类？

、、、

我有一个问题，分类输入有多个标签。因此，问题是多标签分类。我使用了scikit--学习决策树分类器来完成这个任务，并且在初始阶段给出了很好的结果。但是，我想知道它是如何在引擎盖下工作的，以及如何在决策树中进行多标签分类？重要的问题是如何使用两个不同类别的标签同时训练一个曾经初始化过的模型？决策树模型将如何解决两组不同标签的优化任务？

浏览 1提问于2019-09-03得票数 0

2回答

机器学习分类器的主要假设(LG、SVM和决策树)

、、、

在经典统计中，人们通常陈述假定的假设(即数据的正态性和线性，数据的独立性)。但是当我阅读机器学习教科书和教程时，基本的假设并不总是明确或完整的表述。对于二进制分类，以下ML分类器的主要假设是什么，哪些假设不那么重要，哪些必须严格维护？ Logistic回归支持向量机(线性和非线性核) 决策树

浏览 5提问于2016-02-16得票数 7

2回答

不平衡数据的二进制分类模型

、、、

我有一个具有以下规范的数据集：有193,176个样本和2,821个阳性样本的训练数据集测试数据集: 82,887个样本，673个阳性有10个特征。我想执行二进制分类(0或1)。我面临的问题是数据非常不平衡。在对数据进行规范化和缩放之后，再加上一些特性工程，并使用几种不同的算法，这些都是我能够获得的最好的结果： mean square error : 0.00804710026904 Confusion matrix : [[82214 667] [ 0 6]] 也就是只有6个正确的正数。这是用logistic回归。以下是我尝试过的

浏览 0提问于2014-06-23得票数 16

回答已采纳

1回答

带有Adaboost的决策树/树桩

、、

我刚开始与Adaboost一起学习决策树，并在OpenCV上试用，并有一些问题。增强决策树我知道，当我使用Adaboost与决策树，我不断地拟合决策树，以重新加权版本的培训数据。分类以加权多数票进行。当使用Adaboost训练决策树时，我可以使用引导吗？也就是说，我们选择数据集的子集，并在每个子集上训练一棵树，然后将分类器输入Adaboost。增强决策桩我是否对决策桩使用同样的技术？或者我可以创建与功能数量相等的树桩吗？也就是说，如果我有两个有10个特性的类，在将分类器输入Adaboost之前，我会为每个特性总共创建10个决策集。

浏览 8提问于2016-08-08得票数 1

回答已采纳

1回答

弱学习者和弱分类器之间有什么区别吗？

、、、、

当阅读决策树组件时，梯度升压、AdaBoost等。我发现了以下两个概念:弱学习者和弱分类器。是一样的吗？如果有什么不同，那是什么呢？

浏览 0提问于2020-01-05得票数 6

回答已采纳

1回答

如何用滑雪板决策树代替糟糕的选择

、、

我使用sklearn决策树将文档分类为"type1“和"type2”两种可能的类型。我已经分离出几个似乎相关的特性，并尝试手动组合它们来评估模型的结果。在手动对文档进行分类时，我使用以下结果： 1型 2型未知然后，我给一个决策树同样的特征。在这种情况下，结果会更糟，因为它总是尝试将文档分类为"type1“或"type2”的类别之一，但无法将文档分类为“未知”。是否有可能以一种在高度不确定性的情况下不会对文档进行分类而不是选择可能出错的类别的方式来配置sklearn决策树？

浏览 0提问于2018-11-29得票数 3

回答已采纳

2回答

决策树是试图最大化信息获取还是熵？

、、、

据我所知，决策树试图将高熵的分类器放在决策树上。然而，信息的获取是如何发挥作用的呢？信息增益被定义为： InformationGain = EntropyBefore - EntropyAfter 决策树是否试图将信息增益较低的分类器放置在树的顶部？那么，熵总是最大化，信息增益总是最小化吗？对不起，我只是有点糊涂。谢谢!

浏览 1提问于2013-12-19得票数 6

1回答

如果验证数据集有一个新的类别，那么机器学习技术(特别是决策Tress和Logistic回归)会发生什么？

、、、、

假设我有一个数据集，它有一个分类变量，而我正在解决的问题是分类问题。这个分类变量var将“”，“B”，“C”作为可能的数据集。如果一个新的类别'D‘只出现在验证数据集中(意思是:绝对是新的数据)，那么决策树会发生什么？假设变量var是树中使用的特性。带有决策树的：会出错吗？决策树停止路径并返回非最终节点的概率？ Logistic回归的：所有类别的虚拟变量为零(我猜想)，然后模型正常运行吗？

浏览 0提问于2019-04-12得票数 1

回答已采纳

1回答

决策树-非常稀疏特征的预处理

、

如何为决策树的稀疏特性预处理数据？从这个决策树的Turi文档它提到这一点：为什么选择决策树？不同的型号有不同的优点。决策树模型非常擅长处理具有数值特征的表格数据，或少于数百个类别的分类特征。与线性模型不同，决策树能够捕捉特征与目标之间的非线性交互.一个重要的注意事项是，基于树的模型的设计并不是为了处理非常稀疏的特性。当处理稀疏输入数据(例如大维分类特征)时，我们可以对稀疏特征进行预处理以生成数值统计数据，也可以切换到更适合这种情况的线性模型。如果我们有一个非常稀疏的分类列(许多0's)，那么对于这个类别，我们可以对每一行转换什么类型的数字统计？

浏览 0提问于2019-03-07得票数 2

9回答

一般选择哪种机器学习分类器？

假设我在研究分类问题。(欺诈检测和评论垃圾邮件是我目前正在研究的两个问题，但我对任何分类任务都很好奇。) 我如何知道我应该使用哪个分类器？决策树支持向量机贝氏神经网络 K近邻 Q-学习遗传算法马尔可夫决策过程卷积神经网络线性回归或logistic回归加强，包装，诱捕随机爬山或模拟退火 ..。在哪种情况下，这些都是“自然”的第一选择，选择这一选择的原则是什么？我正在寻找的答案类型的例子(来自Manning等人的书)：如果您的数据被标记，但您的数量有限，则应该使用具有高偏见的分类器(例如，朴素贝叶斯)。我猜这是

浏览 17提问于2010-04-07得票数 222

1回答

机器学习分类器的不同用法

、

我已经学习了机器学习中的几种分类器-决策树，神经网络，支持向量机，贝叶斯分类器，K-NN等。谁能帮助我理解什么时候我应该更喜欢其中一个分类器-例如-在哪种情况下(数据集的性质等)我应该更喜欢决策树而不是神经网络，或者哪种情况支持向量机可能比贝叶斯更好？如果这里不是发布这个问题的好地方，很抱歉。谢谢。

浏览 0提问于2013-07-12得票数 0

1回答

何时如何使用套袋？

所有类型的ML方法都能从套袋中受益吗？决策树分类似乎永远是套袋的例子，其他分类器或回归呢？当它适合做袋，如何选择大小和数量袋？更新：我正在寻找一些数学上更严格的东西，例如，对于每一个模型(单个学习者)，我们可以将它的总估计误差分解为： Error^2 = Bias^2 + Variance^2 + Irreducible^2 如果我们能够粗略估计Variance和所有单个学习者的预测之间的相关性，那么我们就可以知道我们能把方差推到多低的程度。

浏览 0提问于2019-01-14得票数 2

1回答

为什么神经网络在结构化数据上表现不好？

、、、

最近我研究了一些分类问题，其中决策树比神经网络表现得更好。我尝试了各种组合的神经网络，改变神经元/隐藏层的数量，目的是击败决策树分类器的准确性，在测试集。但神经网络的最佳精度为0.42，决策树为0.50。我问了一个这里的问题，是什么情况？，有人指出，相对于非结构化数据(比如表示图像中的每个像素)，神经网络对结构化数据(表格格式的数据)不太有效。在与同一答复有关的评论中，有人指出：好吧，你可以看看卡格尔比赛的获奖者。在包含结构化数据的竞赛中，最流行的算法是xgboost (以及其他类似的算法lightgbm、catboost等)。另一方面，神经网络在这些比赛中很少使用，因为它们对这些类型的数

浏览 0提问于2018-09-18得票数 11

1回答

当我的数据很少的时候，优化Sklearn分类器中的参数的最佳方法是什么？

、、

如果我只有684行和177列的数据集，而我要预测的列有3个标签，那么优化Sklearn分类器中的参数的最佳方法是什么？我知道我应该将数据分成训练、验证和测试集，然后找到参数来训练训练集，使验证集中的度量最大化，并在测试集中使用这个优化的分类器。但是，当我使用决策树分类器执行此操作时，对验证集最有效的参数在测试集中显示的结果比默认参数更糟糕。那么，在这个数据集中找到最佳参数的最佳方法是什么呢？我不知道它是否有用，但我的数据集非常稀少。

浏览 0提问于2019-08-07得票数 0

回答已采纳

1回答

如何打印对象值？(php)

我是PHP对象的新手。所以我想对森林进行随机分类。我在打印我的分类中的树决策树时遇到了问题。在本例中，我的结果分类如下： [tree:protected] => Phpml\Classification\DecisionTree\DecisionTreeLeaf Object ( [value] => <= 3.45 [numericValue] => 3.45 [operator]

浏览 18提问于2020-04-02得票数 0

3回答

用于文档分类的决策树

、、、、

嗨，我想知道是否可以使用决策树进行文档分类，如果可以，那么数据表示应该是怎样的？我知道R包在决策树中的用法。

浏览 2提问于2010-06-25得票数 1

回答已采纳

1回答

什么时候基于规则的分类器优于决策树？

、、、

假设我可以在决策树和基于规则的分类器之间做出选择，我应该选择哪一个？假设基于规则的分类器具有相互排斥和详尽的规则集，那么哪一种更可取？基于规则的分类器是否有一些特定的优点/缺点来帮助我们决定它是否比决策树更可取？

浏览 1提问于2015-03-13得票数 0

回答已采纳

1回答

决策树的剪枝与参数约简

、、、

我试图使用决策树分类器来执行分类。我想知道使用特征约简方法是否与决策树相关，因为它们会自动地使用剪枝？我的想法是从5到15参数进行一个循环，然后比较每个决策树的分类精度，然后得出我分类的最优参数数。谢谢。

浏览 0提问于2016-06-24得票数 1

回答已采纳

1回答

存储决策树代码/算法

、、

我有一个作业，我计划使用机器学习(特别是监督学习，比如决策树)。最终的代码将在教学助理的pc上运行，该pc没有安装scikit learn或其他外部库。因此，我需要从头开始编写决策树分类器之类的东西，或者在本地使用外部库，并存储最终的算法。总而言之:当给定一组标记的训练数据时，如何在python代码中存储最终算法，而不依赖外部库在未来运行最终算法？例如，决策树可以分解为一系列if/then语句，我想生成这些if/then语句并存储它们，这样它就可以在除了python之外什么都没有安装的计算机上运行。关于如何实现这一点，最好的建议是什么？如果这是在错误的论坛，请告知。

浏览 0提问于2015-03-10得票数 0

1回答

如何计算决策树的AUC？

、

假设我有一个只有一个连续变量的数据集，我尝试使用决策树算法来构建一个模型，该模型从数据集中对+ve和-ve标签进行分类。我运行10折交叉验证。如何计算决策树分类器的AUC？算法会检查分类器的不同阈值，并确定AUC吗？如果我有两个以上的连续变量呢？谢谢!

浏览 5提问于2014-03-12得票数 1

3回答

如何在sklearn的集成分类器中使用自定义分类器？

、、、

我读到sklearn中的内置集成方法使用决策树作为基本分类器。是否可以使用自定义分类器来代替？

浏览 3提问于2012-05-09得票数 7

回答已采纳

2回答

朴素贝叶斯模型

、、、

当我们使用决策树分类器训练训练集时，我们将得到一个树模型。并且该模型可以被转换为规则，并且可以被合并到java代码中。现在，如果我使用朴素贝叶斯训练训练集，模型是什么形式的？我怎样才能把模型合并到我的java代码中呢？如果训练没有模型，那么朴素贝叶斯和懒惰学习者之间的区别是什么？kNN)？提前谢谢。

浏览 4提问于2013-09-05得票数 4