为什么这个决策树在每一步的值不等于样本的数量？

python、machine-learning、scikit-learn、decision-tree

我正在阅读有关决策树和打包分类器的内容，并尝试展示在打包分类器中使用的第一个决策树。我对输出感到困惑。bag_clf.fit(X_train, y_train) Source(tree.export_graphviz(bag_clf.estimators_[0], out_file=None)) 下面是输出中的一个片段据我所知，value应该显示有多少样本被归类为每个类别。在这种情况下，value字段中的数字不应该与samples字段相加吗？为什么这

浏览 53提问于2019-05-13得票数 3

回答已采纳

3回答

为什么随机森林是决策树的一种改进？

random-forest、decision-trees

假设我们有一个二进制分类问题，我们在数据集上构建了一个决策树。我的问题是:既然决策树在每一步都会选择最佳的特征来分割，那么为什么随机森林(也就是许多决策树)是

浏览 0提问于2019-05-01得票数 2

2回答

使用ExtraTreesClassifier返回全零的功能重要性

python、machine-learning、feature-selection

我想使用ExtraTreesClassifier计算给定数据集的特征重要性。我的目标是为进一步的分类过程找到高得分的特征。X数据集的大小为(10000，50)，其中50列是特征，该数据集仅表示从一个用户(即，来自同一类)收集的数据，Y是标签(全零)。feat_importances.nlargest

浏览 0提问于2019-12-06得票数 0

1回答

cforest party不平衡类

r、random-forest、party

我想用party库中的cforest函数来衡量特征的重要性。有没有办法做到这一点？随机森林是一组

浏览 2提问于2014-10-16得票数 4

1回答

吉尼指数作为叶节标记策略的研究

machine-learning、decision-trees

我们可以使用gini索引将类分配给叶节点吗？如果是，怎么做？据我所知，吉尼指数只能作为分裂指标。

浏览 0提问于2020-04-22得票数 2

1回答

这个抽搐脚趾的伪码是对的吗？

artificial-intelligence、decision-tree

我是人工智能领域的新手，我正在尝试用minimax算法实现tic tac游戏，但在进入之前，我想检查一下我对实现的理解：首先，在移动的每一步，根据网格的当前状态，创建决策树，在决策树生成后，应用最小值对树进行标记，然后根据该标记进行选择，找到下一步的最佳移动，然后从零开始，再对所选的移动进行决策树，并再次应用最小值并选择最佳<

浏览 1提问于2014-01-03得票数 1

回答已采纳

1回答

随机森林回归:提取每棵树终端节点的训练样本

r、regression、random-forest

我想实现的预测处方方法，在这里，他们将机器学习方法和优化方法结合起来。为此，我需要查看森林中每个决策树的终端节点(disjuct区域)。具体来说，我想了解每一棵树的以下情况：这里，对于第一个终端节点，我不感兴趣的是预测m，而是对构成预测基础的值y1、y4和

浏览 3提问于2020-08-24得票数 1

1回答

你能在你的最终测试数据中重用你的火车数据中的观察结果吗？

classification、r、xgboost

在大多数机器学习问题中，您尝试根据未观察到的数据进行预测，与之不同的是，我将处理相同的问题，因为您不会在短时间内看到大量的员工更替。我正在使用XGboost实现。在整个人群中，我的标签告诉员工是否受伤。我使用了70%的数据作为我的训练集，同时测试了其余的30%的准确性。我得到了相当不错的精确等级。我能够准确地对受伤员工进行90%的分类(特异性)。虽然我的

浏览 0提问于2018-05-25得票数 2

5回答

决策树算法是线性的还是非线性的？

machine-learning、classification、decision-trees、algorithms、pac-learning

最近，我的一位朋友在一次采访中被问及决策树算法是线性算法还是非线性算法。我试图寻找这个问题的答案，但没有找到令人满意的解释。有人能回答并解释这个问题的解决方案吗？另外，还有其他一些非线性机器学习算法的例子吗？

浏览 0提问于2015-08-13得票数 37

4回答

在决策树中处理异常值和空值

classification、regression、decision-trees、outlier

离群值:据我所知，决策树对异常值是稳健的。有人能证实我的假设是否正确吗？(如果我的特征从0到9不等，但存在一个值为10000的异常值，那该怎么办？)它是否为这个离群点样本创建了一个单独的叶子，还是会与其他树的叶子合并？谢谢。

浏览 0提问于2018-05-09得票数 6

回答已采纳

2回答

Weka如何在J48和其他分类器中计算输出预测？

weka

我在Weka语言中使用了J48分类器的输出预测，并得到了预测的结果(概率)。由于我需要在我的研究中使用这些预测数，我需要知道weka是如何计算这些数字的？公式是什么？是为每个分类器指定的吗？

浏览 2提问于2015-11-27得票数 0

1回答

关于如何平衡不平衡的数据

machine-learning、scikit-learn、imbalanced-data

当我在Scikit学习中阅读决策树时，我发现：我很困惑。(1) 类平衡可以通过从每个类中抽取相同数量的样本

浏览 2提问于2016-08-24得票数 1

1回答

随机森林模型的假设/局限性

random-forest、ensemble-modeling

随机森林模型的一般假设是什么？我在网上搜索找不到。例如，在线性回归模型中，限制/假设是：假设模型误差不相关且均匀(无奇异性)。类似的条款是否有任何假设/限制。

浏览 0提问于2015-06-05得票数 7

回答已采纳

1回答

TP、TN、FP和FN的总数不等于观测值的总数。

python、tensorflow、keras、metrics、confusion-matrix

我是通过 TensorFlow的。在本教程中，他们使用了。在部分，您可以看到培训示例的数量是182276，验证示例的数量是45569。但是，如果您查看部分中的培训日志，那么您可以看到，FP+TP+FN+TN的和并不等于培训示例的数量。也不等于验证数据的验证示例数。随后的所有时代也是如此。为什么是这种情况？第2

浏览 2提问于2021-01-12得票数 1

1回答

基于信息增益的决策树

tree、decision-tree

如果我在相同数量的节点上得到两个决策树，哪一个被认为更好？树1：(F为假，T为真)这意味着第一个更宽，而第二个更深。

浏览 6提问于2010-12-29得票数 0

回答已采纳

2回答

随机森林分类器中的单热编码

machine-learning、scikit-learn、random-forest

是否需要对python中的随机森林分类器进行一次热编码？我想从逻辑上理解，随机林中是否可以用标签编码来处理分类特性，而不是单热编码。

浏览 4提问于2021-01-14得票数 0

1回答

在每个时期使用不同批次的数据拟合深度学习模型

python、tensorflow、keras、deep-learning

我有一个由不同层组成的深度学习模型。我正在运行它20个时期。我想将整个数据分成20个批次，每个批次将在每个时期进行。那么，如果我有20个切片的数据，有没有一种方法来适应每个时期的每个切片。text_model.fit(x_train, y_train, epochs=20)，模型类的名称是text_model，我希望它适合每个时期。我将非常感谢大家对我的帮助。

浏览 0提问于2021-04-21得票数 0

1回答

无法理解决策树参数的含义

python、scikit-learn

female_age = np.array([51,35,33,67,61]) 无法获得的培训数据42,97,78,76,86])因此，完整的培训数据如下：完整

浏览 3提问于2014-11-09得票数 0

回答已采纳

2回答

为什么我们在随机森林中选择随机特征？

machine-learning、random-forest

据我所知，随机森林是树木套袋的程式化版本。我们选择随机数据点和随机特征来构造随机森林。但是，如果我们只使用普通版本的套袋，只随机选择数据点，那么我们就有了树，它们已经训练了更多的特征，不像样式化版本中的随机森林。由于学习具有更多的特征，每个个体树都有更多关于数据点的信息，因此在某种意义上比随机森林中的个体树更“智能”。那么，为什么使用套袋的程式化版本的随机森林比使用普通套袋实现的

浏览 0提问于2017-07-10得票数 4

回答已采纳

2回答

分类树中“实数”与“判定值”的混淆

machine-learning、decision-trees、xgboost、lightgbm

我正在阅读XGBoost指南，我对它在决策树的评分系统和分类/回归树之间的区别感到困惑。我挂的那一段是：我一点也不确定这意味着什么。我对回归决策树的理解是，每个叶都有一

浏览 0提问于2021-09-13得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

为什么随机森林是决策树的一种改进？

使用ExtraTreesClassifier返回全零的功能重要性

cforest party不平衡类

吉尼指数作为叶节标记策略的研究

这个抽搐脚趾的伪码是对的吗？

随机森林回归:提取每棵树终端节点的训练样本

你能在你的最终测试数据中重用你的火车数据中的观察结果吗？

决策树算法是线性的还是非线性的？

在决策树中处理异常值和空值

Weka如何在J48和其他分类器中计算输出预测？

关于如何平衡不平衡的数据

随机森林模型的假设/局限性

TP、TN、FP和FN的总数不等于观测值的总数。

基于信息增益的决策树

随机森林分类器中的单热编码

在每个时期使用不同批次的数据拟合深度学习模型

无法理解决策树参数的含义

为什么我们在随机森林中选择随机特征？

分类树中“实数”与“判定值”的混淆

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐