如何为使用KFold CV训练的分类模型绘制ROC和PR曲线 - 腾讯云开发者社区

、、、、

我有一些标记为0或1的数据，我试图使用随机森林来预测这些类。每个实例都标记有20个用于训练随机森林的特征(~30.000个训练实例和~6000个测试实例)。我正在用以下代码绘制精确召回和ROC曲线： precision, recall, _ = precision_recall_curve(y_test, y_pred) plt.step(recall, precision, color='b', alpha=0.2,where='post') plt.fill_between(recall, precision, step='post', a

浏览 1提问于2018-07-19得票数 1

回答已采纳

3回答

对整个数据集或培训集进行交叉验证？

、、

我有一个包含77个样本的数据集，有302个带有两个标签(0,1)的特征。我用网格搜索(cv=5)训练支持向量机来进行二值分类。在我的脚本运行中，我做了一个测试-训练分割，然后将训练数据传递到网格搜索中。我获得了广泛的训练准确性(>70%-90%)和测试的准确性(40%-75%)。我的问题是，如果我的模型看起来是基于火车/因为我的数据似乎基于分裂得到了不同的结果，我该如何评估我的模型。我所做的是:在一个循环中运行整个脚本，迭代10种不同的拆分，然后在ROC曲线上绘制错误条。这合理吗？

浏览 0提问于2019-10-17得票数 1

1回答

使用log_loss/roc_auc_loss或执行cross_val_score =‘neg_log_log’/‘roc_auc’的不同结果(Scikit学习)

、、、、

在Scikit的一些分类模型中，我注意到在进行交叉验证时，我获得的日志丢失和ROC AUC的分数一直低于在整个训练集上的拟合和预测(用于检查是否过拟合)，这对我来说是没有意义的。具体来说，使用cross_validate，我将评分设置为['neg_log_loss', 'roc_auc']，在对训练集执行手动拟合和预测时，我使用了度量函数log_loss'和roc_auc_score。为了弄清楚发生了什么，我编写了一个代码来手动执行交叉验证，以便能够在各种折叠上手动调用度量函数，并将结果与cross_validate的结果进行比较。正如你在下面看到的，

浏览 5提问于2020-10-01得票数 2

回答已采纳

4回答

ROC曲线解释

、、、

我训练了一个CNN模型和一个组合的CNN-SVM分类模型。我想用ROC曲线来比较它们的性能，但我搞不懂哪种型号更好。如何解释给定的ROC曲线？ 📷 📷

浏览 0提问于2019-11-24得票数 3

回答已采纳

1回答

预测的标签或预测的概率在中国的阴谋？

、

作为绘制ROC曲线的参数，例如在分类模型中，我可以得到预测的标签和预测的概率。输出层中有softmax层。在分类问题中，我应该使用预测的标签或预测的概率来绘制ROC曲线。

浏览 0提问于2018-05-27得票数 1

1回答

多类分类任务的学习曲线

、、、、

我试图使用我创建的以下函数使用多台机器学习来进行多类分类： def model_roc(X, y): X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, stratify=y, random_state=11) pipeline1 = imbpipeline(steps = [['pca' , PCA()], ['smote', SMOTE('not major

浏览 8提问于2022-08-25得票数 0

1回答

cross_validate中的scikit学习自动适应和训练模型？

、、

# from the titanic dataset X = df.drop(columns="survived") y = df.survived scoring = ['accuracy','precision','roc_auc','f1',] from sklearn.model_selection import cross_validate from sklearn.linear_model import (LogisticRegression) def model_LR(): #logstic Regr

浏览 0提问于2019-12-31得票数 2

回答已采纳

3回答

GridSearch简历:不平衡数据集的合适评分标准

、

我是机器学习的新手。这是我的1^{st}机器学习项目，我正在对不平衡的数据集进行分类。目标变量中也有多个类。我想知道在GridSearchCV中评分最合适的指标是什么。我认为 roc_au有时用于不平衡的数据集。但是有几个 ‘roc_auc’ ‘roc_auc_ovo’ ‘roc_auc_ovr’ 我该用哪一种？或者，查准率-召回_auc也被使用.但我似乎找不到GridSearchCV的评分标准。我如何在GridSearchCV中使用它？谢谢 X_train, X_test, y_train, y_test = train_test_split(X_total, Y_total,

浏览 0提问于2021-10-26得票数 1

1回答

如何嵌套LabelKFold？

、、

我有一个有300个点和32个不同标签的数据集，我想通过网格搜索和LabelKFold验证来绘制它的学习曲线来评估一个LabelKFold模型。我的代码如下所示： import numpy as np from sklearn import preprocessing from sklearn.svm import LinearSVR from sklearn.pipeline import Pipeline from sklearn.cross_validation import LabelKFold from sklearn.grid_search import GridSearchCV

浏览 1提问于2016-06-25得票数 13

回答已采纳

1回答

在维奥拉·琼斯的面部检测纸上是如何绘制ROC曲线的？

、、、、

我在看维奥拉和琼斯的报纸。在那里，他们用ROC曲线来测量分类器的精度。请有人解释一下，在像人脸或非人脸这样的二元分类器中，如何绘制ROC曲线？我是说数据点是如何得到的。 (X，Y)= (假阳性，正确率) 我是否必须为我的训练数据集的每一个正面和负面点计算这些分数。但我的正负数据集大小不一。我有点困惑。

浏览 4提问于2018-02-21得票数 0

1回答

交叉验证Matlab SVM的ROC曲线

、、

我需要为SVM分类器绘制一条ROC曲线，遵循有关主题和matlab示例的许多线索，我喜欢以下内容 mdlSVM = fitcsvm(pred,resp,'Standardize',true); mdlSVM = fitPosterior(mdlSVM); [~,score_svm] = resubPredict(mdlSVM); [Xsvm,Ysvm,Tsvm,AUCsvm] = perfcurve(resp,score_svm(:,mdlSVM.ClassNames),'true'); 到目前为止，一切顺利，我还交叉验证了我的模型。 mdlSVM = fitc

浏览 35提问于2017-08-08得票数 0

回答已采纳

2回答

混淆AUC ROC评分

、、、、

我正在研究二进制分类问题，我试图评估一些分类算法的性能(LR，分解树，随机森林.)。我使用交叉验证技术(避免过度拟合)和AUC ROC作为评分函数来比较算法的性能，但我得到了与随机森林算法和AdbBoost算法的一个奇怪的结果，尽管该算法的召回率和FPR分别不同于1和0，但有一个完美的AUC_ROC评分(即=1)。 📷 def FPR(y_true, y_pred): tn, fp, fn, tp = confusion_matrix(y_true, y_pred).ravel() result = fp / (fp+tn) return result def FNR(

浏览 0提问于2020-07-20得票数 5

回答已采纳

1回答

sklearn用于训练数据的ROC小于0.5的svm区域

、、、

我正在使用sklearn v0.13.1svm来尝试解决一个二进制分类问题。我使用kfold交叉验证并计算roc曲线下的面积(roc_auc)来测试我的模型的质量。然而，对于某些折叠，即使对于训练数据，roc_auc也小于0.5。这不应该是不可能的吗？对于正在训练的数据，算法不是总有可能至少达到0.5吗？下面是我的代码： classifier = svm.SVC(kernel='poly', degree=3, probability=True, max_iter=100000) kf = cross_validation.KFold(len(myData), n_folds

浏览 3提问于2014-02-06得票数 5

1回答

roc_auc in VotingClassifier，RandomForestClassifier in scikit-learn (滑雪)

、、、、

我试图为我所构建的硬投票分类器计算roc_auc。我给出的代码具有可复制的示例。现在我想计算roc_auc分数并绘制ROC曲线，但不幸的是，当表决=“难”时，我得到了以下错误: predict_proba不可用 # Voting Ensemble for Classification import pandas from sklearn import datasets from sklearn import model_selection from sklearn.linear_model import LogisticRegression from sklearn.tree import D

浏览 0提问于2018-07-22得票数 5

回答已采纳

1回答

概率校准正在恶化我的模型性能。

、、

我使用RandomForest和XGBoost进行二进制分类，我的任务是预测每个类的概率。由于基于树的模型输出可用概率不好，我导入了sklearn.calibration CalibratedClassifierCV，在40k上训练了RF，然后用一个单独的10k样本(带有cv="prefit"选项)训练了CCV，我的度量(在ROC下的面积)表现出了巨大的性能下降。改变基估计器的行为对概率校准是否正常？编辑:由于我正在将XGBClassifier上的日志丢失降到最低，输出概率与RF的输出相比并没有那么糟糕。

浏览 0提问于2019-08-07得票数 2

回答已采纳

1回答

R: xgboost图roc曲线

、、

绘制roc曲线： library(ROCR) <data cleaning/scrubbing> <train data> ..... ..... rf.perf = performance(rf.prediction, "tpr", "fpr") #for RF logit.perf = performance (logit.prediction, "tpr", "fpr") #for logistic reg tree.perf = performance(tree.prediction, "t

浏览 2提问于2015-11-04得票数 4

1回答

自定义make_scorer用于roc_auc评分与2类分类中的评分= 'roc_auc‘相比有不同的结果

、、、

我想使用嵌套交叉验证与网格搜索一个2类分类问题，使用roc_auc函数作为一个记分器。我也想打印分类矩阵，所以我尝试创建一个简单的自定义记分器函数来打印分类报告。但是，我得到了一个与这两个函数不同的nested_score。下面是一个使用sklearn示例()中改编的乳腺癌数据集的示例： from sklearn.datasets import load_breast_cancer from matplotlib import pyplot as plt from sklearn.svm import SVC from sklearn.model_selection import GridSe

浏览 0提问于2020-06-22得票数 2

2回答

有什么方法来绘制集合硬投票分类器的ROC曲线吗？

、、

我正在研究一个多类文本分类问题，并为文本分类进行集成学习。我选择硬投票作为合奏技巧。我试图为我的集成方法绘制ROC曲线，但由于显示了ROC曲线不能用于硬投票集成方法这一错误，它是行不通的。因此，我的问题是，是否有任何可能的方法，我可以为我的硬投票集成分类器绘制ROC曲线在python。

浏览 0提问于2020-07-07得票数 3

4回答

如何在R中直接绘制h2o模型对象的ROC

、、

如果我错过了明显的事情我很抱歉。在过去的几天里，我一直非常喜欢使用R界面使用h2o。我想通过绘制一个ROC来评估我的模型，比如随机森林。这些文件似乎表明，有一种直接的方法可以做到这一点：解释DRF模型默认情况下，将显示以下输出：模型参数(隐藏) 得分历史图(树数与训练MSE之比) -- ROC曲线图(TPR对FPR) 变量的图..。我还看到，在python中，您可以应用、roc、函数。但我似乎无法在R界面中找到同样的方法。目前，我正在使用h2o.cross_validation_holdout_predictions从模型中提取预测，然后使用R中的p

浏览 9提问于2017-05-17得票数 5

回答已采纳

1回答

Weka知识流中的负载存在模型

我试图在Weka的同一张图中绘制多条ROC曲线。我已经了解到，我可以在Weka知识流中使用“模型绩效图”来实现这一点。然而，我不知道如何为现有的模型这样做。我尝试使用ArffLoader和TestSetMaker来生成测试数据，并将其连接到一个合适的分类器图标(例如，当这是我试图加载的模型时的AdaBoostM1 )。在分类器图标的配置中，我选择"load model“，在状态栏中显示”load model“。但是，当我运行它时，它会说“错误:没有经过训练的/加载的分类器用于预测”。有人能告诉我我在这里做错了什么吗？提前感谢！

浏览 0提问于2014-11-06得票数 1

回答已采纳

2回答

如何在R中绘制logistic回归(LASSO)的ROC曲线？

、、、

我正在将逻辑回归模型拟合到R中的训练数据集，更具体地说，是一个带有L1惩罚的套索回归。为此，我使用了glmnet包。该模型的代码如下所示。 t1 <- Sys.time() glmnet_classifier <- cv.glmnet(x = dtm_train_tfidf, y = tweets_train[['sentiment']], family = 'binomial', #

浏览 1提问于2018-05-03得票数 0

1回答

显着地过度拟合CV

、、、、

我在做一项二进制分类任务。数据集很小，有1800行和60列。行中没有重复项。我比较了标准分类器中的不同分类器:随机林、logistic回归、增强树和SVC。我用90% (训练)的CV训练超参数，10%的训练来测量泛化误差(测试)。数据集略有不平衡(1 :3的类比例)，因此我对所有的拆分都使用了分层折叠。我还使用roc作为我的简历的衡量标准。我得到了以下的结果，roc的分数和准确性： DummyClassifier Train ROC-AUC score: 0.50000 Accuracy: 0.69705 Test ROC-AUC score: 0.50000 Accuracy: 0.69

浏览 0提问于2018-04-05得票数 1

回答已采纳

1回答

错误预测成功的可能性很高

、、、

我正在研究生产场景中机器故障的行为。为此，我生成随机数据，形成我的不平衡训练集，由分类数据组成，这些数据指示每个子周期中是否存在故障。故障是按指数分布产生的。我有24个特性(Period_1到Period_24)，每个特性都包含448个子周期的历史故障信息。此外，我还有三个特征，包括温度、水分和压力(由正态分布产生)。我的目的是根据这些特性来预测下一阶段的故障行为。我使用了ROC度量，并考虑了处理不平衡数据的几种策略，如过采样、欠采样、ROSE和ADASYN。此外，我试图使用合奏来提高性能。我测试了以下所有模型:梯度增强算法、随机森林、分类和回归树、神经网络、套袋购物车、支持向量机、C5.0

浏览 0提问于2020-08-11得票数 0

1回答

我可以不使用OneVsRestClassifier绘制多类文本分类问题的ROC曲线吗？

、、、、

我有一个泡菜文件，加载时返回一个经过训练的RandomForest分类器。我想为这些类绘制ROC曲线，但从我在网上读到的内容来看，分类器必须被包装在scikit learn的OneVsRestClassifier中。问题是，既然我已经有了受过训练的模型，我就不能把它包装在里面，以便再次适应这个模型。所以我想知道有没有什么办法可以画出中华民国的曲线。从我受过训练的模特身上，我得到了y_test，y_proba。我也有x_test值。我的y_proba示例的形状是：(6715，5) y_test的形状为(6715，5) 这是建议的代码@dx2-66的输出：

浏览 5提问于2022-08-25得票数 0

回答已采纳

1回答

如何使用python绘制多类Xgboost的ROC曲线？

、、

在我的模型中，类是0,1,2,3。由于ROC用于二分类或OneVsRest多类问题，我想绘制类0，1，0，2，0，3的ROC曲线。我该怎么办？

浏览 17提问于2018-06-29得票数 0

1回答

Decision_function用于XGBoost的SKLearn包装器

、、

对于model.predict_proba(X)[:,0]，我得到的结果与SKLearn中的普通Grad决策树分类器的model.decision_function(X)不同，所以我知道这是不一样的。我要模型的分数。绘制ROC曲线等，如何利用XGBoost包装器获得SKLearn分类器的决策函数？为什么predict_proba和分数不同？

浏览 0提问于2018-04-11得票数 0

1回答

在建立机器学习模型时，在什么阶段使用ROC曲线？

、、、、

在开发机器学习模型时，ROC曲线与AUC在哪个阶段使用？通常我有三个数据集 train - validation - final test 在这一阶段，我使用组合的train + validation集进行K倍交叉验证，我们可以计算出包括真阳性、假阳性以及其他度量在内的度量标准，并将它们进行平均，以创建一个类似于ROC曲线的图。类似于来自scikit的这个例子 -学习然而，我们也可以通过训练最终的模型，利用train + validation的所有数据，在test set上进行测试，得到最终的度量，这也可以给我们提供所有的度量、分类报告和ROC曲线等。我的问题是，人们通常会做两次ROC曲

浏览 0提问于2021-01-18得票数 3

1回答

TypeError：init()在桑坦德客户事务数据库中为参数'scoring‘获取了多个值

我正试图在Santander Customer Transaction database上运行LOFOImportance，我遇到了以下错误： import pandas as pd from sklearn.model_selection import KFold from lofo.lofo_importance import LOFOImportance from sklearn.metrics import roc_auc_score df_Train.sort_values("target", inplace=True) cv = KFold(n_splits=

浏览 8提问于2019-09-27得票数 1

1回答

如何在R中绘制SVM模型的ROC曲线

、、

我已经使用以下代码训练和测试了一个模型 library(e1071) library(readxl) library(caret) class1.svm.model <- svm(Class ~ ., data = class1.trainset,cost=20, cross=10,type="C-classification",kernel="radial",na.action=na.omit) class1.svm.pred <- predict(class1.svm.model, class1.testset) finalmatrix<

浏览 0提问于2017-10-20得票数 0

1回答

在KerasRegressor上使用交叉验证时，如何获得不同fits的历史记录？

、、、、

我有一个回归问题，我正在使用keras全连接层来模拟我的问题。我正在使用cross_val_score，我的问题是:如何提取cross_val_score所做的每个训练/验证组合的模型和历史记录？假设这个例子： from sklearn import datasets from sklearn.model_selection import cross_val_score, KFold from keras.models import Sequential from keras.layers import Dense from keras.wrappers.scikit_learn impor

浏览 9提问于2019-11-05得票数 0

回答已采纳

2回答

ROC曲线形状的不确定性

、、、

我正在做一个二元分类，我和AUC一起使用的绘制的ROC曲线对我来说似乎很奇怪。下面是一个例子。 📷 据我所知，中华民国是真实阳性率与假阳性率的视觉代表。在绘制混淆矩阵时，我可以看到大量的假阴性和假阳性： 📷 我不明白为什么中华民国的曲线只有一个断点。因此，我的问题是，为什么我们会有这样的形状，而不是典型的平滑(呃)单调增长的形状？我尝试使用n_iter参数RandomizedSearchCV、n_splits of StratifiedKFold和使用的分类器估计器(LogisticRegression()，RandomForestClassifier())。完全可复制代码： from s

浏览 0提问于2022-02-27得票数 3

1回答

使用PRROC软件包在ROC曲线中的数据值

、、

我试图绘制一个标识符的ROC曲线，该标识符用于根据背景数据集确定正事件。标识符是两个组之间有一些重叠的概率分数的列表。 FG BG 0.02 0.10 0.03 0.25 0.02 0.12 0.04 0.16 0.05 0.45 0.12 0.31 0.13 0.20 (其中FG =正，BG =负) 我正在用R中的PRROC绘制ROC曲线，以评估标识符如何将数据分类为正确的组。虽然在正数据集和负数据集之间产生的分类器值有明显的区别，但我目前的ROC图在R中显示出较低的AUC值

浏览 4提问于2017-11-24得票数 2

回答已采纳

1回答

所有观察的置信度评分在0.50-0.55之间。

、、、

你好，数据科学堆栈交换社区，这个问题似乎是开放式的，但任何答案或想法都会受到欢迎。我试图通过一个预先训练的随机模型分类器与最小的文档，如什么是混淆矩阵，ROC-AUC曲线的分类问题时，模型被开发。我只有泡菜文件和它需要运行的数据集。当我运行模型时，我观察到大多数情况下，预测评分或信心评分在0.50至0.55之间。我想知道这样说对吗？“模型可能已经学会了这种模式，甚至很难，所有的信心分数都在0.50到0.55之间” 因为我想解释一下，既然所有的预测得分都集中在一个单一的值上，那么说模型学到了什么是不对的，而且如果有人试图绘制AUC，那么它就应该是直线。再一次，任何想法和答案都将是非常感激的

浏览 0提问于2021-02-16得票数 1

1回答

K折交叉验证ROC曲线的绘制

、、、、

我正在处理一个不平衡的数据集。在应用ML模型之前，我将数据集分成测试集和训练集，然后应用SMOTE算法来平衡数据集。我想应用交叉验证，绘制每个褶皱的ROC曲线，显示每个褶皱的AUC，并在图中显示AUC的平均值。我将重采样的训练集变量命名为X_train_res和y_train_res，代码如下： cv = StratifiedKFold(n_splits=10) classifier = SVC(kernel='sigmoid',probability=True,random_state=0) tprs = [] aucs = [] mean_fpr = np.linspac

浏览 6提问于2019-08-29得票数 2

回答已采纳

1回答

如何评估我的MLPClassifier模型？需要ROC曲线吗？

、、、

如何评估我的MLPClassifier模型？混淆矩阵、准确性、分类报告是否足够？我需要ROC来评估我的MLPClassifier结果吗？此外，我还使用了loss_curve函数，但它只显示了训练集的损失图。 Ps。我在处理多类分类问题。

浏览 5提问于2022-06-20得票数 0

回答已采纳

2回答

如何解释不平衡测试集的PR曲线和ROC曲线

、、、、

我在一个数据集上训练了一个神经网络，测试集非常不平衡，正负比为1:25000。所有积极的例子都是正确预测的，相反，正确预测的负面因素占总否定量的99%。 PR和ROC曲线的作图如下： 📷 从这些曲线可以推断出什么？这些都是我第一次使用量词，我很困惑。我认为精度总是很低，因为被错误地预测为肯定的否定词有一个高分，由分类器分配(接近1)。相反，我认为这是很高的，因为所有正面的例子都是正确预测的。这是我的假设，如果我错了，请纠正我。

浏览 0提问于2018-06-26得票数 1

1回答

用插入符号包进行GBM分类

、

当使用插入符号的训练函数拟合GBM分类模型时，函数predictionFunction将概率预测转换为基于概率阈值0.5的因子。 out <- ifelse(gbmProb >= .5, modelFit$obsLevels[1], modelFit$obsLevels[2]) ## to correspond to gbmClasses definition above 如果用户试图使ROC曲线下的面积最大化，这种转换似乎为时过早。虽然灵敏度和特异性对应于单个概率阈值(因此需要因子预测)，但我更希望使用gbmPredict的原始概率输出来计算AUROC。在

浏览 2提问于2014-01-20得票数 0

回答已采纳

4回答

如何绘制SciKit-Learn线性回归图

、、、

我是SciKit-Learn的新手，我一直在kaggle上研究一个回归问题(king county csv)。我一直在训练一个回归模型来预测房价，我想画出图表，但我不知道怎么做。我使用的是python 3.6。如有任何建议或建议，我们将不胜感激。 #importing numpy and pandas, seaborn import numpy as np #linear algebra import pandas as pd #datapreprocessing, CSV file I/O import seaborn as sns #for plotting graphs from s

浏览 76提问于2020-07-12得票数 0

回答已采纳

1回答

朱莉娅的随机森林与ROC曲线

、、、、

我正在使用包的风味来为一个数据集的二进制分类问题创建一个随机森林模型(有关ScikitLearn风味的含义，请参见DecisionTree.jl主页底部)。我还使用包进行模型评估。我已经建立了一个随机森林模型，我的数据，并希望为这个模型创建一个ROC曲线。阅读现有的文档，我确实理解了ROC曲线在理论上是什么。我只是想不出如何为特定的模型创建一个模型。在中，下面用粗体斜体标记的第一句的最后一部分是引起我困惑的部分：“在统计中，接收机操作特性( ROC )或ROC曲线是一幅图形图，它演示了二进制分类器系统的性能，因为它的识别阈值是可变的。”在整篇文章中有更多关于阈值的内容，但这仍然使我对二进制

浏览 6提问于2016-10-12得票数 6

1回答

使用keras绘制Roc曲线

、、、

我有一个神经网络模型，我正在使用KerasClassifier，然后使用KFold进行交叉验证。现在我在绘制ROC曲线时遇到了问题。我已经尝试了几个代码，但大多数都给我一个错误的多标签是不解释的。我有以下代码，直到我的神经网络产生准确性。如果有人能帮助我完成代码的后面部分，我将不胜感激。 import numpy as np import pandas as pd from keras.layers import Dense, Input from keras.models import Model, Sequential from keras.wrappers.scikit_learn im

浏览 25提问于2018-08-30得票数 1

回答已采纳

1回答

Logistic回归的ROC异常

、、

目前，我正在学习logistic回归和LDA (线性判别分析)分类。我正在尝试以不同的方式生成数据，以学习逻辑回归和LDA行为。这是2维预测值的数据可视化，类被绘制为颜色：下面是我的代码： library(ggplot2) library(MASS) set.seed(1) a <- mvrnorm(n = 1000, mu = c(0,0), Sigma = matrix(c(0.4,0,0,0.4), nrow = 2, ncol = 2)) b <- mvrnorm(n = 1000, mu = c(0,0), Sigma = matrix(c(10,0,0,10)

浏览 0提问于2018-10-07得票数 1

1回答

由混淆矩阵绘制ROC曲线

、、

我需要确定不同的分类模型预测值的好坏。为了做到这一点，我需要绘制ROC曲线，但我正在努力开发一种方法。我包含了我的整个python代码以及我使用的数据集的链接。它看起来代码很多，但实际上很简单。我发现的主要问题是，我有一个3x3的混淆矩阵，不知道如何将其转换为ROC图。任何帮助都是非常感谢的。数据集： <code>C0</code> <code>A1</code>

浏览 44提问于2019-08-21得票数 0

2回答

测试台接收机工作特性(ROC)

、

下面的图片对我来说肯定是有意义的。假设你有一些经过训练的二进制分类器A，B (B并不比随机猜测等好多少)。以及一个由n个测试样本组成的测试集，用于所有这些分类器。由于对所有n个样本都计算了精确性和召回性，因此与分类器对应的点是有意义的。现在，有时人们谈论ROC曲线，我知道精度是由回忆或简单的精确性(回忆)来表示的。我不明白这种可变性是从何而来的，因为您有固定数量的测试样本。您是否只是选择测试集的某些子集，并找到精确性和回忆性，以便绘制它们，从而绘制许多离散值(或插值行)？

浏览 2提问于2015-08-13得票数 3

回答已采纳

1回答

离散预测的ROC曲线

、

我有一个分类器，它可以预测二进制类数据集的概率和类。我想将它与另一个预测器进行比较，后者只输出每个情况的二进制类。我获得了性能分数，但现在我需要在ROC曲线中显示差异。我可以使用R中的ROCR和pROC等软件包绘制连续预测(概率)的ROC曲线。由于第二个预测器只输出二进制类，我正在四处寻找可以用来绘制离散预测(二进制) ROC曲线的东西。谢谢!

浏览 0提问于2013-05-06得票数 2

回答已采纳

1回答

如何绘制多类分类器的准确率和召回率？

、、、、

我正在使用scikit learn，我想要绘制精确度和召回率曲线。我使用的分类器是RandomForestClassifier。scikit学习文档中的所有资源都使用二进制分类。另外，我可以绘制多类的ROC曲线吗？此外，我只找到了多标签的支持向量机，它有一个RandomForest没有的decision_function

浏览 5提问于2019-05-11得票数 20

回答已采纳

1回答

使用精确召回AUC作为交叉验证中的评分标准的Sklearn ->

、

我想使用AUC的精确和召回曲线作为一个指标来训练我的模型。当使用交叉验证时，我是否需要为此做一个特定的记分员？请考虑以下可重复的示例。注意不平衡的目标变量。 from sklearn.datasets import make_classification from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split, RepeatedStratifiedKFold # generate 2 class dataset X, y = make_c

浏览 6提问于2021-05-24得票数 2

回答已采纳

2回答

为朴素贝叶斯分类建立一条ROC曲线有意义吗？

、、、、

这几天，在大学里，我们一直在学习NaiveBayes。因为它是一种分类算法，所以我想知道我是否可以用相同的方法(使用相同的度量)来评估NaiveBayes模型，我们评估其他分类算法，比如支持向量机、LogisticRegression或DecisionTrees。对我来说，使用精度、回忆或F1评分这样的指标来评估它是有意义的。但我对像中华民国曲线或PR曲线这样的指标表示怀疑？用这些曲线来评价我的模型是正确的吗？或者为NaiveBayes模型建立一个ROC/PR曲线是没有意义的？非常感谢！)

浏览 0提问于2022-12-11得票数 0

1回答

使用KFold CV或分层CV时，计算性能指标的正确方法是什么？

、、、、

在阅读了一些教程之后，这是我第一次构建Keras深度学习模型，因为我是机器学习和深度学习的初学者。大多数教程都使用训练-测试拆分来训练和测试模型。然而，我选择使用StratifiedKFold CV。代码如下所示。 X = dataset[:,0:80].astype(float) Y = dataset[:,80] kfold = StratifiedKFold(n_splits=10,random_state=seed) for train, test in kfold.split(X, Y): # create model model = Sequential() mod

浏览 25提问于2020-01-17得票数 0

1回答

嵌套交叉验证的正确过程是什么？

、、、

我正在尝试使用scikit-学习做一个分类器，然后预测分类器的准确性。我的数据集相对较小，我不确定最佳参数。因此，我转向嵌套交叉验证(nCV)来建立和测试我的模型。我一直在努力理解最好的方法。然而，在阅读之后：我仍然不知道如何才能进行下去。到目前为止，我已经： (80%/20%)将整个数据集划分为训练集和测试集，定义了内部cv、外部cv、参数网格和估计器(随机森林)运行nCV以获得平均精度分数。要做到这一点，到目前为止我的代码是： X_train, X_test, Y_train, Y_test = train_test_split(X_res, Y_res, test_size=

浏览 0提问于2020-10-07得票数 1

1回答

如何根据这些数据绘制ROC曲线？

、、、、

我已经使用Keras训练了一个卷积神经网络(CNN)，并进行了以下操作，以便在测试数据集上找到准确性： for root, dirs, files in os.walk(test_directory): for file in files: img = cv2.imread(root + '/' + file) img = cv2.resize(img,(512,512),interpolation=cv2.INTER_AREA) img = np.expand_dims(img, axis=0) img

浏览 32提问于2019-01-06得票数 0