如何从标签和概率中找到TPR和TPR来评估我的模型？ - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ROC曲线的含义以及画法

ROC的全名叫做Receiver Operating Characteristic（受试者工作特征曲线），又称为感受性曲线（sensitivity curve）。得此名的原因在于曲线上各点反映着相同的感受性，它们都是对同一信号刺激的反应，只不过是在几种不同的判定标准下所得的结果而已。其主要分析工具是一个画在二维平面上的曲线——ROC 曲线。ROC曲线以真正例率TPR为纵轴，以假正例率FPR为横轴，在不同的阈值下获得坐标点，并连接各个坐标点，得到ROC曲线。对于一个分类任务的测试集，其本身有正负两类标签，我们对于这个测试集有一个预测标签，也是正负值。分类器开始对样本进行分类时，首先会计算该样本属于正确类别的概率，进而对样本的类别进行预测。比如说给出一组图片，让分类器判断该图片是否为汉堡，分类器在开始分类前会首先计算该图片为汉堡的概率，进而对该图片的类别进行预测，是汉堡或者不是汉堡。我们用概率来表示横坐标，真实类别表示纵坐标，分类器在测试集上的效果就可以用散点图来表示，如图所示

01

在不平衡数据上使用AUPRC替代ROC-AUC

来源：DeepHub IMBA本文约2000字，建议阅读7分钟尽管 ROC-AUC 包含了许多有用的评估信息，但它并不是一个万能的衡量标准。 ROC曲线和曲线下面积AUC被广泛用于评估二元分类器的性能。但是有时，基于精确召回曲线下面积 (AUPRC) 的测量来评估不平衡数据的分类却更为合适。本文将详细比较这两种测量方法，并说明在AUPRC数据不平衡的情况下衡量性能时的优势。预备知识——计算曲线我假设您熟悉准确率和召回率以及混淆矩阵的元素（TP、FN、FP、TN）这些基本知识。如果你不熟悉可以搜索我们以

01

您找到你想要的搜索结果了吗？

是的

没有找到

在不平衡数据上使用AUPRC替代ROC-AUC

ROC曲线和曲线下面积AUC被广泛用于评估二元分类器的性能。但是有时，基于精确召回曲线下面积 (AUPRC) 的测量来评估不平衡数据的分类却更为合适。

02

如何评估机器学习模型的性能

您可以整天训练有监督的机器学习模型，但是除非您评估其性能，否则您永远无法知道模型是否有用。这个详细的讨论回顾了您必须考虑的各种性能指标，并对它们的含义和工作方式提供了直观的解释。

02

Python 深度学习目标检测评价指标

准确率（Accuracy），混淆矩阵（Confusion Matrix），精确率（Precision），召回率（Recall），平均正确率（AP），mean Average Precision(mAP)，交除并（IoU），ROC + AUC，非极大值抑制（NMS）。

02

【机器学习 | 分类指标大全】全面解析分类评估指标：从准确率到AUC，多分类问题也不在话下，确定不来看看？

🙋‍♂️声明：本人目前大学就读于大二，研究兴趣方向人工智能&硬件（虽然硬件还没开始玩，但一直很感兴趣！希望大佬带带）

06

【机器学习 | 分类指标大全】全面解析分类评估指标：从准确率到AUC，多分类问题也不在话下，确定不来看看？

表示真正类（True Positive）的样本数，即被分类器正确预测为正类的样本数；

04

机器学习-ROC曲线：技术解析与实战应用

机器学习和数据科学在解决复杂问题时，经常需要评估模型的性能。其中，ROC（Receiver Operating Characteristic）曲线是一种非常有用的工具，被广泛应用于分类问题中。该工具不仅在医学检测、信号处理中有着悠久的历史，而且在近年来的机器学习应用中也显得尤为关键。

01

简单聊聊模型的性能评估标准

在机器学习领域中，对模型的评估非常重要，只有选择和问题相匹配的评估方法，才能快速发现算法模型或者训练过程的问题，迭代地对模型进行优化。

02

一文读懂二元分类模型评估指标

在分类模型中，有很多关于模型性能的评估指标（evaluation metric），比如 accuracy、precision、recall、f1-score、roc、auc、prc 等等。这里慢慢梳理下这些指标的含义以及用途。

08

模型评估：评价指标-附sklearn API

主要有分类（classification）、回归（regression）、排序（ranking）、聚类（clustering）、热门主题模型（topic modeling）、推荐（recommendation）等。

02

盘一盘 Python 系列特别篇 - Sklearn (0.22)

在〖机器学习之 Sklearn〗一贴中，我们已经介绍过 Sklearn，它全称是 Scikit-learn，是基于 Python 语言的机器学习工具。

04

AI-逻辑回归模型

逻辑回归（Logistic Regression）是机器学习中的一种分类模型，逻辑回归是一种分类算法，虽然名字中带有回归。由于算法的简单和高效，在实际中应用非常广泛☺️

Physica A 2020 | 链接预测综述（三）

题目：Link prediction techniques, applications, and performance: A survey

01

又是模型评估？到底怎么评估？『附 AUC 评估的三计算方法』

前面一节提到了模型评估指标中 ROC 的详细概念和四个常见的问题，以后在遇到 ROC 想必再也不会发懵了：聊聊模型评估的事儿，附 roc 常见的四个灵魂发问

01

如何使用Apache Spark MLlib预测电信客户流失

Spark MLLib是一个用于在海量数据集上执行机器学习和相关任务的库。使用MLlib，可以对十亿个观测值进行机器学习模型的拟合，可能只需要几行代码并利用数百台机器就能达到。MLlib大大简化了模型开发过程。

01

机器学习必刷题-基础概念篇(1)：为什么用AUC做评价指标？

由于AUC关联的内容比较多，面试时问得也非常细，因此，我们将按照以下顺序对AUC进行重点介绍。

02

【统计】 ROC曲线(1) - 模型评估首选方案

ROC曲线，也称“受试者工作特征曲线”，主要是用于X对Y的预测准确率情况。最初ROC曲线是运用在军事上，现在更多应用在医学领域，判断某种因素对于某种疾病的诊断是否有诊断价值。

02

一文读懂机器学习分类模型评价指标

解决一个机器学习问题都是从问题建模开始，首先需要收集问题的资料，深入理解问题，然后将问题抽象成机器可预测的问题。在这个过程中要明确业务指标和模型预测目标，根据预测目标选择适当指标用于模型评估。接着从原始数据中选择最相关的样本子集用于模型训练，并对样本子集划分训练集和测试集，应用交叉验证的方法对模型进行选择和评估。

02

入门 | 机器学习模型的衡量不止准确率：还有精度和召回率

选自Medium 作者：William Koehrsen 机器之心编译参与：Nurhachu Null、刘晓坤我们倾向于使用准确率，是因为熟悉它的定义，而不是因为它是评估模型的最佳工具！精度（查准率）和召回率（查全率）等指标对衡量机器学习的模型性能是非常基本的，特别是在不平衡分布数据集的案例中，在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。 GitHub 地址：https://github.com/WillKoehrsen/Data-Analysis/blob/master/recall_pre

05

小白也能看懂的 ROC 曲线详解

ROC 曲线是一种坐标图式的分析工具，是由二战中的电子和雷达工程师发明的，发明之初是用来侦测敌军飞机、船舰，后来被应用于医学、生物学、犯罪心理学。

03

scikit-learn工具包中分类模型predict_proba、predict、decision_function用法详解「建议收藏」

在使用sklearn训练完分类模型后，下一步就是要验证一下模型的预测结果，对于分类模型，sklearn中通常提供了predict_proba、predict、decision_function三种方法来展示模型对于输入样本的评判结果。

01

精度是远远不够的：如何最好地评估一个分类器？

分类模型（分类器）是一种有监督的机器学习模型，其中目标变量是离散的（即类别）。评估一个机器学习模型和建立模型一样重要。我们建立模型的目的是对全新的未见过的数据进行处理，因此，要建立一个鲁棒的模型，就需要对模型进行全面而又深入的评估。当涉及到分类模型时，评估过程变得有些棘手。

03

【AI初识境】深度学习模型评估，从图像分类到生成模型

图像分类是计算机视觉中最基础的一个任务，也是几乎所有的基准模型进行比较的任务，从最开始比较简单的10分类的灰度图像手写数字识别mnist，到后来更大一点的10分类的cifar10和100分类的cifar100，到后来的imagenet，图像分类任务伴随着数据库的增长，一步一步提升到了今天的水平。现在在Imagenet这样的超过1000万图像，2万类的数据集中，计算机的图像分类水准已经超过了人类。

01

数据分析及算法总结

简洁的讲: 如果一个样本在特定的空间中的K个最邻近的中的大多数属于某个类,则这个样本属于这个类.

03

一文深度解读模型评估方法

我们训练学习好的模型，通过客观地评估模型性能，才能更好实际运用决策。模型评估主要有：预测误差情况、拟合程度、模型稳定性等方面。还有一些场景对于模型预测速度（吞吐量）、计算资源耗用量、可解释性等也会有要求，这里不做展开。

06

贾尚文_roc指标详解及实战用法

其中，TP(真正，True Positive)表示真正结果为正例，预测结果也是正例；FP(假正，False Positive)表示真实结果为负例，预测结果却是正例；TN（真负，True Negative）表示真实结果为正例，预测结果却是负例；FN（假负，False Negative）表示真实结果为负例，预测结果也是负例。显然，TP+FP+FN+TN=样本总数。

04

从零开始学Python【38】--朴素贝叶斯模型（实战部分）

在《从零开始学Python【37】--朴素贝叶斯模型（理论部分）》中我们详细介绍了朴素贝叶斯算法的基本概念和理论知识，在这一期我们继续介绍该算法的实战案例。将会对高斯贝叶斯、多项式贝叶斯和伯努利贝叶斯三种分类器案例的做实战讲解。希望通过这部分内容的讲解，能够使读者对贝叶斯算法有一个较深的理解（文末有数据和源代码的下载链接）。

04

机器学习-基础知识 - PR、ROC曲线与AUC

事实上机器学习训练好的模型在对测试样本进行预测的时候，输出的原始结果是模型预测该样本为正样本的概率，而不是我们平时经常听到的Positive或Negative，而概率如何转化为机器学习的输出靠的是一个阈值，当概率大于阈值则判断其为正样本，反之为负样本。

04

RS Meet DL(75)-考虑CPM的评估方法csAUC

在点击率预估中，AUC是最常用的评估指标，这一指标衡量的是任取一个正例和负例，正例的得分高于负例的概率。那么点击率预估中，正例和负例分别是什么呢？很显然，正例就是用户点击过的item，负例是用户没有点击的item。

01

模型评估指标AUC和ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

02

【基础】模型评估指标 AUC 和 ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

05

模型评估指标AUC和ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

01

Physica A 2020 | 链接预测综述（二）

题目：Link prediction techniques, applications, and performance: A survey

01

当Sklearn遇上Plotly，会擦出怎样的火花？

Plotly：协同 Python 和 matplotlib 工作的 web 绘图库官网链接：https://plot.ly/python/

01

深度学习500问——Chapter02：机器学习基础（3）

2. 投影思想：找出最能够代表原始数据的投影方法。被PCA降掉的那些维度只能是那些噪声或是冗余的数据。

01

回归评估指标——准确率、精准率、召回率、F1、ROC曲线、AUC曲线

机器学习有很多评估的指标。有了这些指标我们就横向的比较哪些模型的表现更好。我们先从整体上来看看主流的评估指标都有哪些：

02

趣析逻辑回归模型评价指标

Python 实现的逻辑回归后，不像 SAS 那样会自动给出模型精确度的评价，需要人为操作计算 Python 专属的 AUC (Area Under Curve)，ROC 曲线与 X 轴围成的面积大小反映了模型的精度。本文将着重 AUC 值和 ROC 曲线背后的原理和 Python 代码实现。

01

【机器学习笔记】：一文让你彻底记住什么是ROC/AUC（看不懂你来找我）

ROC/AUC作为机器学习的评估指标非常重要，也是面试中经常出现的问题（80%都会问到）。其实，理解它并不是非常难，但是好多朋友都遇到了一个相同的问题，那就是：每次看书的时候都很明白，但回过头就忘了，经常容易将概念弄混。还有的朋友面试之前背下来了，但是一紧张大脑一片空白全忘了，导致回答的很差。

02

机器学习模型评估指标总结！

本文对机器学习模型评估指标进行了完整总结。机器学习的数据集一般被划分为训练集和测试集，训练集用于训练模型，测试集则用于评估模型。针对不同的机器学习问题（分类、排序、回归、序列预测等），评估指标决定了我们如何衡量模型的好坏。

02

详解准确率、精确率、召回率、F1值等评价指标的含义

很简单，我们可以定一些评价指标，来度量模型的优劣。比如准确率、精确率、召回率、F1值、ROC、AUC等指标，但是你清楚这些指标的具体含义吗？下面我们一起来看看吧。

05

R语言︱分类器的性能表现评价（混淆矩阵，准确率，召回率，F1,mAP、ROC曲线）

笔者寄语：分类器算法最后都会有一个预测精度，而预测精度都会写一个混淆矩阵，所有的训练数据都会落入这个矩阵中，而对角线上的数字代表了预测正确的数目，即True Positive+True Nagetive。

03

一份非常全面的机器学习分类与回归算法的评估指标汇总

读完机器学习算法常识之后，你已经知道了什么是欠拟合和过拟合、偏差和方差以及贝叶斯误差。在这篇给大家介绍一些机器学习中离线评估模型性能的一些指标。

05

机器学习中分类任务的常用评估指标和python代码实现

混淆矩阵定义为（类x类）大小的矩阵，因此对于二进制分类，它是2x2，对于3类问题，它是3x3，依此类推。为简单起见，让我们考虑二元分类并了解矩阵的组成部分。

01

深度学习实战-MNIST数据集的二分类

MNIST数据集是一组由美国高中生和人口调查局员工手写的70,000个数字的图片，每张图片上面有代表的数字标记。

03

分类评估方法-召回率、ROC与混淆矩阵

精确率（Precision）与召回率（Recall）是分类任务中的常用指标，首先需要知道混淆矩阵。

03

ROC分析

算法工作中，经常要对模型进行评估，由此衍生出很多指标。比如Accuracy、Precision、Recall、F1-score、AUC等等。准确理解各指标的内涵、使用场景及局限，还挺有挑战。更佳阅读体验，请移步ROC分析。

02

AUC 的缺陷是什么？

目前普遍认为接收器工作特性（Receiver Operating Characteristic，ROC）曲线下的面积 ——AUC 是评估分类模型准确性的标准方法。它避免了在阈值选择过程中假定的主观性，当连续的概率得到的分数被转换为二分类标签时，通过总结整体模型表现，其衡量模型区分正负样本的性能优于通过阈值来判断的其他方法（比如准确率、召回率等）。在这篇手稿中，我们回顾了这一度量的一些特点，并将其作为模型结果的准确性的比较度量，对其可靠性提出了质疑。我们不建议使用 AUC 出于五个原因：

01

机器学习基础：别乱用 AUC

目前普遍认为接收器工作特性（Receiver Operating Characteristic，ROC）曲线下的面积 ——AUC 是评估分类模型准确性的标准方法。它避免了在阈值选择过程中假定的主观性，当连续的概率得到的分数被转换为二分类标签时，通过总结整体模型表现，其衡量模型区分正负样本的性能优于通过阈值来判断的其他方法（比如准确率、召回率等）。在这篇手稿中，我们回顾了这一度量的一些特点，并将其作为模型结果的准确性的比较度量，对其可靠性提出了质疑。我们不建议使用 AUC 出于五个原因：

01

模型评估

知识点：准确率（Accuracy）,精确率（Precision）,召回率（Recall）,均方根误差（RMSE）

04

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭