开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

ROC曲线完美，但预测精度不高

ROC曲线（Receiver Operating Characteristic curve）是一种用于评估分类模型性能的工具，它展示了在不同分类阈值下，真阳性率（True Positive Rate）与假阳性率（False Positive Rate）之间的关系。ROC曲线的完美表示模型在所有分类阈值下都能实现100%的真阳性率和0%的假阳性率，即曲线沿着左上角的边界移动。

然而，即使ROC曲线完美，预测精度仍可能不高。预测精度是指模型在预测中的准确性，通常通过计算准确率、召回率、F1分数等指标来衡量。如果预测精度不高，可能是由于以下原因：

数据质量：模型的预测精度受到训练数据的质量影响。如果训练数据存在噪声、缺失值或不平衡问题，模型的预测精度可能会降低。解决方法包括数据清洗、特征选择和数据平衡技术等。
特征选择：选择合适的特征对于提高模型的预测精度至关重要。特征选择可以通过统计方法、特征重要性评估或领域知识来完成。选择与目标变量相关性强的特征可以提高模型的预测能力。
模型选择：不同的模型适用于不同的问题和数据集。选择合适的模型可以提高预测精度。常见的分类模型包括逻辑回归、支持向量机、决策树、随机森林等。腾讯云提供了多种机器学习相关产品，如腾讯云机器学习平台（https://cloud.tencent.com/product/tcmlp）和腾讯云自然语言处理（https://cloud.tencent.com/product/nlp）等。
参数调优：模型的参数设置对于模型的预测精度有重要影响。通过调整模型的参数，可以优化模型的性能。腾讯云提供了自动调参工具，如腾讯云机器学习平台的超参优化功能，可以帮助用户自动搜索最佳参数组合。
数据量和样本分布：模型的预测精度通常受到数据量和样本分布的影响。如果数据量较小或样本分布不均衡，模型可能无法充分学习到数据的特征。解决方法包括增加数据量、数据增强和样本平衡技术等。

总结起来，要提高预测精度，需要关注数据质量、特征选择、模型选择、参数调优以及数据量和样本分布等因素。腾讯云提供了多种相关产品和服务，可以帮助用户在云计算环境中进行数据处理、模型训练和预测等任务。

相关搜索:Keras模型精度较高，但预测能力较差 Python指标ROC曲线:直方图的负预测价值？ROC曲线和精度召回曲线 Tensorflow官方MNIST模型训练精度高但预测性能低在R中绘制ROC曲线时预测错误？如何评估分类器的精度，并在GridSearchCV中留下一条roc曲线？每次精度都很高，但结果预测是错误的用于完美标签的ROC曲线由包ROCR颠倒地产生良好的训练精度和验证精度，但预测精度较差部署CNN:高训练和测试精度但低预测精度

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

关于机器学习，不可不知的15个概念

‍‍ 作者：布奇·昆托（Butch Quinto）来源：大数据DT（ID：hzdashuju）有监督学习有监督学习是利用训练数据集进行预测的机器学习任务。有监督学习可以分为分类和回归。回归用于预测“价格”“温度”或“距离”等连续值，而分类用于预测“是”或“否”、“垃圾邮件”或“非垃圾邮件”、“恶性”或“良性”等类别。分类包含三种类型的分类任务：二元分类、多类别分类和多标签分类。回归中包含线性回归和生存回归。无监督学习无监督学习是一种机器学习任务，它在不需要标记响应的情况下发现数据集中隐藏

02

机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率

同见博客：http://zhwhong.ml/2017/04/14/ROC-AUC-Precision-Recall-analysis/(对Latex公式支持更好) ---- 在分类任务中，人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上，这样的度量错误掩盖了样例如何被分错的事实。在机器学习中，有一个普遍适用的称为混淆矩阵(confusion matrix)的工具，它可以帮助人们更好地了解分类中的错误。比如有这样一个在房子周围可能发现的动物类型的预测，这

06

机器学习模型性能的10个指标

尽管大模型非常强大，但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比，解释现实中的物理现象，未必要用到量子力学。有些相对简单的问题，或许一个统计分布就足够了。对机器学习而言，也不用言必深度学习与神经网络，关键在于明确问题的边界。

02

机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率

在分类任务中，人们总是喜欢基于错误率来衡量分类器任务的成功程度。错误率指的是在所有测试样例中错分的样例比例。实际上，这样的度量错误掩盖了样例如何被分错的事实。在机器学习中，有一个普遍适用的称为混淆矩阵

04

什么是ROC曲线？为什么要使用ROC?以及 AUC的计算

真正（True Positive , TP）被模型预测为正的正样本；假负（False Negative , FN）被模型预测为负的正样本；假正（False Positive , FP）被模型预测为正的负样本；真负（True Negative , TN）被模型预测为负的负样本。

03

100+数据科学面试问题和答案总结 - 基础知识和数据分析

来自Amazon，google，Meta, Microsoft等的面试问题，问题很多所以对问题进行了分类整理，本文包含基础知识和数据分析相关问题

02

算法工程师-机器学习面试题总结(1)

损失函数是在机器学习和优化算法中使用的一种衡量模型预测结果与真实值之间差异的函数。其目标是最小化模型的预测误差，从而提高模型的性能。

02

Precision, Recall, F-score, ROC, AUC

正样本就是使系统得出正确结论的例子,负样本相反。比如你要从一堆猫狗图片中检测出狗的图片，那么狗就是正样本，猫就是负样本；反过来你若是想检测出猫的图片，那么猫就是正样本，狗就是负样本。

01

【基础】模型评估指标 AUC 和 ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

05

模型评估指标AUC和ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

01

模型评估指标AUC和ROC，这是我看到的最透彻的讲解

blog.csdn.net/liweibin1994/article/details/79462554

02

精度是远远不够的：如何最好地评估一个分类器？

分类模型（分类器）是一种有监督的机器学习模型，其中目标变量是离散的（即类别）。评估一个机器学习模型和建立模型一样重要。我们建立模型的目的是对全新的未见过的数据进行处理，因此，要建立一个鲁棒的模型，就需要对模型进行全面而又深入的评估。当涉及到分类模型时，评估过程变得有些棘手。

03

分类模型评估指标

对于构建好的机器学习模型，需要对模型的效果进行评估，对于机器学习中的3大类问题，分类，回归，聚类而言，各自有不同的评估指标，本文主要介绍分类模型常用的评估指标。

02

R语言航班延误影响预测分析：lasso、决策树、朴素贝叶斯、QDA、LDA、缺失值处理、k折交叉验证

航班延误是航空公司、旅客和机场管理方面都面临的一个重要问题。航班延误不仅会给旅客带来不便，还会对航空公司和机场的运营产生负面影响。因此，对航班延误的影响因素进行预测分析，对于航空公司、旅客和机场管理方面都具有重要意义。

00

机器学习评估指标的十个常见面试问题

来源：DeepHub IMBA本文约2700字，建议阅读5分钟本文整理了10个常见的问题。评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定，所以评估指标在机器学习模型的开发和部署中发挥着至关重要的作用。所以评估指标是面试时经常会被问到的基础问题，本文整理了10个常见的问题。 1、你能在机器学习的背景下解释精度和召

02

纵向联邦学习技术在汽车增换购业务中的应用与实践

题图摄于香港由于微信公众号更改显示规则，请点击上面“亨利笔记”，再点击右上角”..."，选择“设为星标”，以免错过更新。（转发FATE开源社区的文章）很荣幸为大家带来一篇亚信科技的精彩投稿。随着联邦学习技术的迭代，逐步在多个场景落地，其中以营销推广、金融风控为典型代表。该文章将通过实践案例，与大家分享纵向联邦学习技术在汽车增换购业务中的应用与实践。文章包括方案设计、案例实践过程、以及效果总结等非常细致的内容。文章由亚信科技（中国）有限公司AISWare AI² FL产品经理吴珺撰写，感谢亚信科技及

02

一文读懂机器学习分类模型评价指标

解决一个机器学习问题都是从问题建模开始，首先需要收集问题的资料，深入理解问题，然后将问题抽象成机器可预测的问题。在这个过程中要明确业务指标和模型预测目标，根据预测目标选择适当指标用于模型评估。接着从原始数据中选择最相关的样本子集用于模型训练，并对样本子集划分训练集和测试集，应用交叉验证的方法对模型进行选择和评估。

02

深度学习500问——Chapter02：机器学习基础（1）

机器学习起源于上世纪50年代，1959年在IBM工作的Arthur Samuel设计了一个下棋程序，这个程序具有学习的能力，它可以在不断的对弈中提高自己。由此提出了“机器学习”这个概念，它是一个结合了多个学科，如概率论、优化理论、统计等，最终在计算机上实现自我获取新知识，学习改善自己的这样一个研究领域。机器学习是人工智能的一个子集，目前已经发展处许多有用的方法，比如支持向量机，回归，决策树，随机森林，强化学习，集成学习，深度学习等等，一定程度上可以帮助人们完成一些数据预测，自动化，自动决策，最优化等初步替代脑力的任务。本章我们主要介绍下机器学习的基本概念、监督学习、分类算法、逻辑回归、代价函数、损失函数、LDA、PCA、决策树、支持向量机、EM算法、聚类和降维以及模型评估有哪些方法、指标等等。

01

【Python机器学习】系列之从线性回归到逻辑回归篇（深度详细附源码）

第1章机器学习基础将机器学习定义成一种通过学习经验改善工作效果的程序研究与设计过程。其他章节都以这个定义为基础，后面每一章里介绍的机器学习模型都是按照这个思路解决任务，评估效果。第2章线性回归介绍线性回归模型，一种解释变量和模型参数与连续的响应变量相关的模型。本章介绍成本函数的定义，通过最小二乘法求解模型参数获得最优模型。第3章特征提取与处理很多机器学习问题需要研究的对象可能是分类变量、文字甚至图像。本章介绍提取这些变量特征的方法。这些技术是数据处理的前提——序列化，更是机器学习的基

R语言中回归和分类模型选择的性能指标

有多种性能指标来描述机器学习模型的质量。但是，问题是，对于哪个问题正确的方法是什么？在这里，我讨论了选择回归模型和分类模型时最重要的性能指标。请注意，此处介绍的性能指标不应用于特征选择，因为它们没有考虑模型的复杂性。

00

银行风控案例：Logistics模型预测银行贷款违约

在面试中会经常碰到考察对数据挖掘算法的熟悉程度，面试官会出一道题或给出一些数据，让你结合实际谈谈你选择什么模型，该模型的大致原理是什么，使用条件有哪些，模型优缺点，如何选择特征，模型如何调参优化，如何评估模型效果等。以下将要介绍逻辑回归，以历史数据判断银行或P2P金融机构客户贷款违约情况。逻辑回归是用来做分类任务的。分类任务的目标是找一个函数，把观测值匹配到相关的类或标签上。算法必须用成对的特征向量和对应的标签来估计匹配函数的参数，从而实现更好的分类效果。在二元分类中，分类算法必须把一个实例配置两个类别

《机器学习》-- 第二章：模型评估与选择

(1) 误差：学习器的实际预测输出与样本的真实输出之间的差异；其中学习器在训练集上的误差称为”训练误差“（training error），在新样本上的误差称为”泛化误差“（generalization error）。值得一提的是，学习器就是在训练集上训练出来的，但实际上在回到训练集上对样本预测结果时，仍有误差。（即结果值与标记值不同）

03

ROC，AUC，Precision，Recall，F1的介绍与计算

ROC曲线和AUC常被用来评价一个二值分类器（binary classifier）的优劣，ROC曲线称为受试者工作特征曲线（receiver operating characteristic curve，简称ROC曲线），又称为感受性曲线（sensitivity curve），AUC（Area Under Curve）是ROC曲线下的面积。在计算ROC曲线之前，首先要了解一些基本概念。在二元分类模型的预测结果有四种，以判断人是否有病为例：

02

Weka机器学习使用介绍（数据+算法+实战）

Weka是怀卡托智能分析环境(Waikato Environment for Knowledge Analysis)的英文字首缩写，新西兰怀卡托大学用Java开发的数据挖掘著名开源软件。功能有数据处理、特征选择、分类、回归、可视化等，支持多种数据文件格式，如arff、xrff、csv等，主流的数据格式是csv和arff。

04

《百面机器学习》读书笔记之：特征工程 & 模型评估

对数值类型的特征做归一化可以将所有的特征都统一到一个大致相同的数值区间内。这样做的目的是消除数据特征之间的量纲影响，使得不同的指标之间具有可比性，帮助在进行迭代优化（如梯度下降）时更快地收敛至最优解。最常用的归一化方法有以下两种：

02

数据分析和机器学习的11个高级可视化图表介绍

可视化是一种强大的工具，用于以直观和可理解的方式传达复杂的数据模式和关系。它们在数据分析中发挥着至关重要的作用，提供了通常难以从原始数据或传统数字表示中辨别出来的见解。

02

轻松了解模型评价指标

混淆矩阵：也称为误差矩阵，是一种特定的表格布局，允许可视化算法的性能，通常是监督学习的算法（在无监督学习通常称为匹配矩阵）。矩阵的每一行代表预测类中的实例，而每列代表实际类中的实例（反之亦然）。从字面理解：看出系统是否混淆了两个类（即通常将一个类错误标记为另一个类）（多类可以合并为二分类）。

03

二分类相关评估指标（召回率、准确率，精确率，f1，auc和roc）

工作 20x20 大小的人脸检测，为了获取尽可能多的负样本，拍摄一张 1000x1000 像素大小的车的图像，将其拆分为 20x20 大小的片段，⇒ 50x50 也可将 1000x1000 ⇒ 拆分为 10x10 大小，100x100 副负样本图像，为了保持大小的一致，还需进一步将其拉伸到 20x20 的大小；

06

NLP入门+实战必读：一文教会你完整机器处理流程

无论是初入 AI 行业的新人，还是想转行成为 AI 领域的技术工程师，都可以在本篇文章中，收获入门 NLP 和实战的相关知识。

02

NLP入门实战：一文教会你完整机器处理流程

无论是初入 AI 行业的新人，还是想转行成为 AI 领域的技术工程师，都可以在本篇文章中，收获入门 NLP 和实战的相关知识。

03

【数据】数据科学面试问题集一

数据科学也被称为数据驱动型决策，是一个跨学科领域，涉及以各种形式从数据中提取知识的科学方法，过程和系统，并基于这些知识进行决策。数据科学家不应仅仅根据他/她对机器学习的知识进行评估，而且他/她也应该具有良好的统计专业知识。我将尝试从非常基础的数据科学入手，然后慢慢转向专家级。所以让我们开始吧。

00

ROC和AUC也不是评估机器学习性能的金标准

对于不平衡数据集，AUC值是分类器效果评估的常用标准。但如果在解释时不仔细，它也会有一些误导。以Davis and Goadrich (2006)中的模型为例。如图所示，左侧展示的是两个模型的ROC曲线，右侧展示的是precision-recall曲线 (PRC)。

00

R语言组lasso改进逻辑回归变量选择分析高血压、易感因素、2型糖尿病和LDL可视化

本文用逻辑回归和lasso算法医学上的疾病的相关因素，帮助客户确定哪种模型可用于某种疾病的相关因素分析。3个模型：Logistic模型、成组Lasso Logistic模型、由组Lasso选出协变量的Logistic模型，有3个易感因素、高血压、2型糖尿病和LDL，得出误差率和变量数目的图。

00

【干货】7种最常用的机器学习算法衡量指标

【导读】你可能在你的机器学习研究或项目中使用分类精度、均方误差这些方法衡量模型的性能。当然，在进行实验的时候，一种或两种衡量指标并不能说明一个模型的好坏，因此我们需要了解常用的几种机器学习算法衡量指标

06

A.深度学习基础入门篇[二]：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解

A.深度学习基础入门篇二：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解

03

文献学习：机器学习方法帮助缩短就诊时间

今天给大家分享一篇2022年发表于JAMA network open（IF13.3）上面的文章，文章使用机器学习方法预测患者是否诊断为某种疾病，帮助提高急诊运行效率，缩短患者等待时间！

02

ROC及AUC计算方法及原理「建议收藏」

在大多数情况下不同类别的分类代价并不相等，即将样本分类为正例或反例的代价是不能相提并论的。例如在垃圾邮件过滤中，我们希望重要的邮件永远不要被误判为垃圾邮件，还有在癌症检测中，宁愿误判也不漏判。在这种情况下，仅仅使用分类错误率来度量是不充分的，这样的度量错误掩盖了样本如何被错分的事实。所以，在分类中，当某个类别的重要性高于其他类别时，可以使用Precison和Recall多个比分类错误率更好的新指标。

05

中文NLP用什么？中文自然语言处理的完整机器处理流程

人工智能头条早先发布的文章《用 Python 构建 NLP Pipeline，从思路到具体代码，这篇文章一次性都讲到了》，是基于英文来举例的。

05

情感分析的新方法，使用word2vec对微博文本进行情感分析和分类

情感分析是一种常见的自然语言处理（NLP）方法的应用，特别是在以提取文本的情感内容为目标的分类方法中。通过这种方式，情感分析可以被视为利用一些情感得分指标来量化定性数据的方法。尽管情绪在很大程度上是主观的，但是情感量化分析已经有很多有用的实践，比如企业分析消费者对产品的反馈信息，或者检测在线评论中的差评信息。最简单的情感分析方法是利用词语的正负属性来判定。句子中的每个单词都有一个得分，乐观的单词得分为 +1，悲观的单词则为 -1。然后我们对句子中所有单词得分进行加总求和得到一个最终的情

图解 72 个机器学习基础知识点

来源：尤而小屋 R语言统计与绘图本文约5500字，建议阅读11分钟本文梳理了机器学习最常见的知识要点。图解机器学习算法系列以图解的生动方式，阐述机器学习核心知识 & 重要模型，并通过代码讲通应用细节。 1. 机器学习概述 1）什么是机器学习人工智能（Artificial intelligence）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念，人工智能的最终目标是使计算机能够模拟人的思维方式和行为。大概在上世纪50年代，人工智能开始

03

图解 72 个机器学习基础知识点

人工智能（Artificial intelligence）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念，人工智能的最终目标是使计算机能够模拟人的思维方式和行为。

01

图解 72 个机器学习基础知识点

人工智能（Artificial intelligence）是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。它是一个笼统而宽泛的概念，人工智能的最终目标是使计算机能够模拟人的思维方式和行为。

02

UCI 信用卡数据集的二元分类分析

人工智能（AI）为改变我们分配信贷和处理风险的方式提供了一个机会，并创造了更公平、更包容的系统。人工智能可以避免传统的信用报告和评分系统，这有助于抛弃现有的偏见，使它成为一个难得的，改变现状的机会。然而，人工智能很容易朝另一个方向发展，加剧现有的偏见，创造出一个循环，加强有偏见的信贷分配，同时使贷款歧视更难找到。我们将通过开源模型Fairlearn来释放积极的一面，缓解偏见消极的一面。

02

机器学习day4

二值分类器是机器学习中最常见的分类器。评价的指标也有很多，precision，recall，F1 score等等。ROC曲线也是之一。 ROC，Receiver Operating Characteristic Curve，受试者工作特征曲线。 ROC曲线的横坐标为假阳性率（False Positive Rate，FPR），纵坐标为真阳性率（True Positive Rate，TPR）。

02

预测建模、监督机器学习和模式分类概览

模式分类（pattern classification）和机器学习（machine learning）是非常热的话题，几乎在所有的现代应用程序中都得到了应用：例如邮局中的光学字符识别（OCR），电子邮件过滤，超市条形码扫描，等等。在这篇文章中，我会简要描述一个典型的监督学习任务的主要概念，这些概念将作为将来的文章和实现各种学习算法的基础。机器学习和模式分类预测建模是建立一个能够进行预测的模型的通用概念。通常情况下，这样的模型包括一个机器学习算法，以便从训练数据集中学习某些属性做出这些预测。预测建模可

05

ROC的计算与绘制

最近工作需要绘制ROC曲线，对该曲线的计算细节进行了一番摸索。当前搜索ROC曲线一般跟机器学习相关联，导致我对它的概念有了曲解，理所当然地以为它只是一个用于机器学习的分类器评估标准，所以在绘制曲线前使用逻辑回归（我的响应变量是0-1类型）对数据建模分析。实则不然，ROC曲线适用于任何判断0-1类型（真假、成功失败等二分类）响应结果阈值分割效果的评估。

05

【机器学习】一文详尽介绍模型评估指标

在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标，针对不同机器学习问题如回归、分类、排序，其评估指标也会不同。

01

「R」ROC三剑客（一）使用R语言手撕ROC曲线

之前因工作需要绘制ROC曲线，所以对该曲线的计算细节进行了一番摸索。刚开始我搜索ROC曲线一般跟机器学习相关联，导致我对它的概念有了曲解，理所当然地以为它只是一个用于机器学习的分类器评估标准，所以在绘制曲线前应当使用逻辑回归等模型对数据建模分析。实则不然，ROC曲线适用于任何判断0-1类型（真假、成功失败等二分类）响应结果阈值分割效果的评估。这个道理我在2018年前后是不懂的，当时一想到画ROC、计算AUC就懵逼。

02

「R」使用R语言手撕ROC曲线

之前因工作需要绘制ROC曲线，所以对该曲线的计算细节进行了一番摸索。刚开始我搜索ROC曲线一般跟机器学习相关联，导致我对它的概念有了曲解，理所当然地以为它只是一个用于机器学习的分类器评估标准，所以在绘制曲线前应当使用逻辑回归等模型对数据建模分析。实则不然，ROC曲线适用于任何判断0-1类型（真假、成功失败等二分类）响应结果阈值分割效果的评估。这个道理我在2018年前后是不懂的，当时一想到画ROC、计算AUC就懵逼。

00

一文详尽系列之模型评估指标

在机器学习领域通常会根据实际的业务场景拟定相应的不同的业务指标，针对不同机器学习问题如回归、分类、排序，其评估指标也会不同。

01

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭