随机森林的ROC曲线在R中使用pROC拟合对象，以正“投票”或负“投票”作为预测器

、、、

权重是一个连续的预测因子。使用RF对肥胖进行分类： library(randomFores) inbag 0 -none- NULL terms 3 terms call 我相信投票矩阵显示了从0到1，rF为将每个病例分类到任何一个类别所投<

浏览 53提问于2019-03-21得票数 2

回答已采纳

2回答

当使用多个分类器-如何衡量整体的性能？[SciKit学习]

、、、、

现在，分类器在10倍CV的训练集上具有大致相似的性能指标(83-94%的准确率/精度/等等)，所以我的“朴素”方法是简单地使用多个分类器(随机森林、ExtraTrees、支持向量机(线性核)、支持向量机我的问题是:如何获得不同分类器和/或它们的投票预测的性能指标？也就是说，我想看看使用多个分类器是否能提高我的性能，或

浏览 2提问于2014-02-01得票数 8

回答已采纳

2回答

有什么方法来绘制集合硬投票分类器的ROC曲线吗？

、、

我选择硬投票作为合奏技巧。我试图为我的集成方法绘制ROC曲线，但由于显示了ROC曲线不能用于硬投票集成方法这一错误，它是行不通的。因此，我的问题是，是否有任何可能的方法，我可以为我的硬投票集成分类器绘制ROC曲线在python。

浏览 0提问于2020-07-07得票数 3

1回答

套袋与增压的区别

、、、

有人能解释一下袋装和助推之间的基本区别吗?在哪种情况下可以使用哪种技术？

浏览 0提问于2018-10-12得票数 1

回答已采纳

1回答

如何在r中检查randomForest中的拆分值？(对森林的解释

、、、

我正在使用randomForest在r中构建一个随机森林。我所有的特征都是绝对的。例如，我的特色“2020年大选投票方法”的响应为{"“、"AB”、"AP“、"MB”、"P"}。我想知道我的树是否通常在空字符串和其他响应之间分裂(表示投票方法比是否记录表决更重要)。我一直在检查森林中<

浏览 3提问于2022-04-13得票数 2

2回答

利用scikit并行生成随机森林-学习

、、、、

主要问题:我如何将python和scikit中的不同randomForests结合起来--学习？我目前正在使用R中的randomForest包来使用弹性映射约简来生成随机森林对象。由于输入数据太大，无法在一台机器上容纳内存，所以我将数据采样到较小的数据集中，并生成包含较小树集的随机森林对象。然后，我使

浏览 12提问于2014-09-18得票数 9

回答已采纳

3回答

随机森林分类器- KFold CV调很深的树->过配？

、、、

我正在对python中的随机森林进行调优，并想知道我的模型是否/为什么过于合适。AUC或F1 (由于数据不平衡) 我得到的结果倾向于建议使用非常深的树，即深度18，不限制每次分割的样本数=2(默认)。在树的最大深度上，我的分数几乎是单调增加的。考虑到结果和树有多深-我怀疑这个模型太合适了？如果是这样的话，为什么我不观察到在</e

浏览 0提问于2018-06-19得票数 3

2回答

ROCR包裹..。我没有得到什么？

、

我正在用R中的ROCR包测试一个简单的案例--基本上，这是我的代码。我有一组真值，对于每个值，我都有一组预测，如果预测值在真值的1以内，则标签是1，否则为0，如下所示： preds<-c(6,3,2,1,4) predtest<-prediction(df$preds, df$labels) auc <- performance(predte

浏览 6提问于2016-05-17得票数 2

回答已采纳

2回答

如何通过添加额外的树来提高单个决策树的性能？

、、

我有一个二进制分类任务，数据存在不平衡问题(99%为负，1%为正)。我能够建立一个决策树，仔细调整，加权，和后修剪。以tree1为例，它具有较高的召回率和中等的高精度，在检测正实例方面表现良好。我想知道如何通过集成方法(打包、提升、堆叠等)来提高它的性能。需要注意的一点是，由于实时性要求，在我们的生产环境中不允许使用大量的树(例如，带有100+

浏览 0提问于2023-03-20得票数 1

2回答

从一组随机图像中过滤出照片的算法

、、、

我有一堆随机的图像文件(纸质文档扫描，徽标，当然还有相机拍摄的照片)，我只需要过滤掉照片来创建预览。在上提出的解决方案只能在有限的方式下工作(即，一些标志是完全黑色的字体，一些标志只有颜色-没有白色区域)，有时我扫描了一张白纸，其中包含多张周围有空白的照片-我也需要识别这些照片-因为这样我就必须键入白色部分，并将扫描中的照片保存在单独的文件中。

浏览 0提问于2013-04-30得票数 0

回答已采纳

1回答

求最佳单调曲线拟合

编辑:在我问了这个问题一段时间后，一个名为MonoPoly (available )的R包出现了，它做了我想做的事情。我强烈推荐它。最初，我一直在对我的结果进行多重拟合，直到我找到了一个特定的数据集，这个结果才开始很好地工作。此数据集中的数据具有非单调性。

浏览 4提问于2016-04-05得票数 5

回答已采纳

1回答

用层次随机林模型估计类概率

、、、

我使用随机森林分类器( R)来预测多个本地植物群落的空间分布，使用各种环境变量作为预测因子。这个分类系统是分层的，每个连续的级别在其类描述中变得更加详细。例如，我有一个有两个层次的层次分类系统，最高的层次由两类组成:森林(F)和草地(G)。在第二级，每个森林和草地类由2个子类(F1、F2和G1、G2)组成。例如，使用</

浏览 3提问于2014-04-14得票数 1

回答已采纳

3回答

在R中创建多条ROC曲线？

、

我的目标是创造150个AUC分数。auc(roc(df$label, df$col1)), ...我可以在这里使用Map/sapply/lapply，但是还有其他方法或函数吗？

浏览 0提问于2018-04-16得票数 3

回答已采纳

11回答

在R中计算AUC？

、、、

给定一个分数向量和一个实际类别标签向量，如何在R语言或简单的英语中计算二元分类器的单数AUC度量？的第9页似乎要求知道类标签，这里是我不理解的因为R(不要与R语言混淆)被定义为向量而被用作函数？

浏览 6提问于2011-02-05得票数 52

回答已采纳

1回答

我应该用哪种统计技术来进行一次人内重复测量的研究？

、、、

我想看看人格特征(5个特征变量值从0到5)是否可以预测某人是否会在工作中给予反馈(离散的结果，是/否)，以及他们会提供什么样的反馈(利克特所以，我有我的自变量(人格)，我试图预测我的重复测量结果变量(反馈)。我还有参与者在多大程度上实际上是一个主持人变量，与反馈数据一起收集的</em

浏览 0提问于2023-05-24得票数 1

3回答

用什么预测模型来推断性别？

、、

我的数据如下：birth_date缺少634,990个值由于我有900 k项，这两项都是相当大的数量，所以我不能丢弃空行。对于birth_date，有人建议使用链式方程(小鼠)的多变量计算。我不知道我应该为gender使用什么预测模型。在未缺少的数据中，男性比女性多5倍。我使用这

浏览 0提问于2019-05-07得票数 5

回答已采纳

2回答

我已经使用tensorflow决策森林创建了一个分类模型。我正在努力评估非默认指标(在本例中为PR-AUC)的性能与树的数量之间的变化。下面是我尝试的一些代码。，使用 tfdf_clf.make_inspector().training_logs() #[TrainLog(num_trees=1, evaluation=Evaluation(num_examples0.9005518555641174, loss=0.5672071

浏览 46提问于2021-10-22得票数 2

1回答

Flink SVM 90%的错误分类

、、、

我尝试使用flink-ml实现进行一些二进制分类。当我评估分类时，我在训练数据集上得到了大约85%的错误率。我绘制了3D数据，看起来你可以用超平面很好地分离数据。当我试图从支持向量机中获得权重向量时，我只看到了在不拦截超平面的情况下获得权重向量的选项。所以只有一个超平面通过(0,0,0)。绘制的数据如下所示：

浏览 4提问于2017-12-02得票数 7

4回答

有多少种方法来检查模型是否过模？

、、

我试着避免在我所能想到的所有方法中过度拟合，嵌套交叉验证的平均输出是r2 0.88，我不确定我是否可以相信它，或者是否有其他方法可以看到这是否过度合适。比较两种特征选择方法(一种使用xgboost从SHAP值中认为重要的特征，另一种使用Boruta，这两种方法在10个嵌套的CV k-折叠中平均给出0.87-0.88 r2，而在57个特征中仅删除3

浏览 0提问于2020-07-07得票数 3

回答已采纳

2回答

多项式数据与R的glm()

、

如何让R的glm()匹配多项式数据？我已经尝试了几次'family=AAA(link="BBB")‘的迭代，但我似乎无法得到与之匹配的微不足道的预测。例如，请使用R的glm帮助匹配多项式数据y=x*xplot(parabola)test=data.frame(x=seq(-5,5,2)

浏览 1提问于2014-02-13得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

当使用多个分类器-如何衡量整体的性能？[SciKit学习]

有什么方法来绘制集合硬投票分类器的ROC曲线吗？

套袋与增压的区别

如何在r中检查randomForest中的拆分值？(对森林的解释

利用scikit并行生成随机森林-学习

随机森林分类器- KFold CV调很深的树->过配？

ROCR包裹..。我没有得到什么？

如何通过添加额外的树来提高单个决策树的性能？

从一组随机图像中过滤出照片的算法

求最佳单调曲线拟合

用层次随机林模型估计类概率

在R中创建多条ROC曲线？

在R中计算AUC？

我应该用哪种统计技术来进行一次人内重复测量的研究？

用什么预测模型来推断性别？

Tensorflow决策森林自定义指标与树的数量

Flink SVM 90%的错误分类

有多少种方法来检查模型是否过模？

多项式数据与R的glm()

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐