开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

为什么使用二进制精度作为度量标准会产生较高的准确率(95%)，而简单的准确率会产生较低的值(46%)

使用二进制精度作为度量标准可以产生较高的准确率（95%），而简单的准确率会产生较低的值（46%）的原因是：

二进制精度是一种更细粒度的度量标准，它将结果分为两个类别：正类和负类。正类表示预测结果为真，负类表示预测结果为假。这种二元分类的方式可以更准确地衡量模型的性能。
二进制精度考虑了四个重要的指标：真正例（True Positive，TP）、真负例（True Negative，TN）、假正例（False Positive，FP）和假负例（False Negative，FN）。通过计算这些指标，可以得出更全面的模型准确性评估。
简单的准确率只考虑了正确预测的样本数量与总样本数量之间的比例，它无法区分不同类别的预测结果。因此，简单的准确率无法准确地反映模型的性能。
二进制精度可以更好地评估模型在不同类别上的表现。它可以衡量模型对正类和负类的预测能力，从而提供更准确的性能评估。
在实际应用中，二进制精度可以用于评估各种分类任务，例如垃圾邮件过滤、疾病诊断等。通过使用二进制精度作为度量标准，可以更好地评估模型在不同任务中的准确性。

推荐的腾讯云相关产品和产品介绍链接地址：

腾讯云机器学习平台（https://cloud.tencent.com/product/tiia）
腾讯云人工智能开放平台（https://cloud.tencent.com/product/ai）
腾讯云大数据与人工智能（https://cloud.tencent.com/solution/big-data-ai）
腾讯云云服务器（https://cloud.tencent.com/product/cvm）
腾讯云云数据库 MySQL 版（https://cloud.tencent.com/product/cdb_mysql）
腾讯云云原生容器服务（https://cloud.tencent.com/product/tke）
腾讯云音视频处理（https://cloud.tencent.com/product/mps）
腾讯云物联网平台（https://cloud.tencent.com/product/iotexplorer）
腾讯云移动开发平台（https://cloud.tencent.com/product/mpp）
腾讯云对象存储（https://cloud.tencent.com/product/cos）
腾讯云区块链服务（https://cloud.tencent.com/product/bcs）
腾讯云元宇宙（https://cloud.tencent.com/product/tencent-meta-universe）

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

如何通过交叉验证改善你的训练数据集？

假设这样一种情况，你对一个样本不均匀的数据集做了一段时间的处理，在这期间你用其中一部分数据做试验，测试了n种机器学习方法，然后喜闻乐见的发现每次的准确率都高达95%。你觉得这95%的准确率真的是实至名归吗？

02

机器学习模型性能的10个指标

尽管大模型非常强大，但是解决实践的问题也可以不全部依赖于大模型。一个不太确切的类比，解释现实中的物理现象，未必要用到量子力学。有些相对简单的问题，或许一个统计分布就足够了。对机器学习而言，也不用言必深度学习与神经网络，关键在于明确问题的边界。

02

[文献阅读]用于大规模图像检索的深度哈希网络研究

春恋慕阅读西安电子科技大学陈鹏飞的论文用于大规模图像检索的深度哈希网络研究李聪的技术博客

05

分类的评价指标

知道模型的准确性是必要的，但仅仅了解模型的性能水平还不够。因此，还有其他评估指标可帮助我们更好地了解模型的性能。其中一些指标是精度，召回率，ROC曲线和F1得分。

01

【翻译】A New Approach for Sparse Matrix Classification Based on Deep Learning Techniques

2018 IEEE International Conference on Cluster Computing

02

大规模图像检索的深度哈希方法简介

传统的图像检索过程，先通过人工对图像进行文字标注，再利用关键字来检索图像，这种依据图像描述的字符匹配程度提供检索结果的方法，称为“以字找图”(text-based image retrieval)，既耗时又主观多义。如今每一秒都有数百万图片通过各种渠道上传到各种大规模存储设备中。给定一张查询图片，快速从百万量级的图像数据库中通过图像特征来找出内容相近的一定数量的图片，这种任务被称为“基于内容的图像检索”(content-based image retrieval (CBIR))，是目前非常流行的研究方向。

机器学习中的新数学，加速AI训练离不开数字表示方式和基本计算的变革

近年来 AI 领域的发展令人震惊，但为完成这些壮举而训练神经网络的成本也异常巨大。以大规模语言模型 GPT-3 和艺术生成器 DALL-E 2 为例，它们需要在高性能 GPU 集群上训练数月时间，耗资数百万美元，消耗百万亿计的基本计算。

03

Facebook新研究优化硬件浮点运算，强化AI模型运行速率

近年来，计算密集型的人工智能任务推动了各种用于高效运行这些强大的新型系统的定制化硬件的出现。我们采用浮点运算来训练深度学习模型，如 ResNet-50 卷积神经网络。但是，由于浮点数十分消耗资源，真正部署的人工智能系统通常依赖于使用 int8/32 数学运算的少数几个流行的整型量化技术。

03

寻找最佳的神经网络架构，韩松组两篇论文解读

第二篇则是利用强化学习自动寻找在特定 latency 标准上精度最好的量化神经网络结构，它分别为网络的每一层搜索不同 bit 的权值和激活，得到一个经过优化的混合精度模型。两篇文章的相同之处在于，都直接从特定的硬件获得反馈信息，如 latency，energy 和 storage，而不是使用代理信息，再利用这些信息直接优化神经网络架构 (或量化 bit 数) 搜索算法。这也许会成为工业界未来的新范式。

01

算法研习：决策树算法基本原理分析

决策树(Decision Trees，DT)是一中监督机器学习算法，该算法根据数据的特征进行逐层划分直到划分完所有的特征，这一过程类似于树叶生长过程。决策树算法可用于解决分类和回归问题，在实际数据分析中有着广泛的应用。下面我们从以下5个方面来分析一下决策树算法：

01

深度度量学习的这十三年，难道是错付了吗？

「度量学习（Metric Learning）」即学习一个度量空间，在该空间中的学习异常高效，这种方法用于小样本分类时效果很好，不过度量学习方法的效果尚未在回归或强化学习等其他元学习领域中验证。

02

R语言基于树的方法：决策树，随机森林，套袋Bagging，增强树

本文是有关基于树的回归和分类方法的。用于分割预测变量空间的分割规则可以汇总在树中，因此通常称为决策树方法。

00

脑机接口中最优特征选择的多目标共生生物搜索算法（一）

今天分享一篇关于EEG特征选择优化的论文，发表于一区Top期刊Expert System with Applicaitons的论文Multi-objective symbiotic organism search algorithm for optimal feature selection in brain computer interfaces。

04

评价对象检测模型的数字度量:F1分数以及它们如何帮助评估模型的表现

使用精度和召回率评估目标检测模型可以为模型在不同置信度下的表现提供有价值的见解。类似地，F1分数在确定平衡给定模型的精度和查全率值的最佳置信度时特别有用;但是，该值跨越了从0到1的置信值域。单个值评估指标可以从一个给定模型的F1分数集导出，这可能是一个很好的模型性能指标。

06

【人工智能】技术总结

P(A∣B)=P(A)P(B∣A)P(B)P(A|B) = \frac{P(A)P(B|A)}{P(B)} P(A∣B)=P(B)P(A)P(B∣A)

02

混淆矩阵

混淆矩阵是一个表，经常用来描述分类模型(或“分类器”)在已知真实值的一组测试数据上的性能。混淆矩阵本身比较容易理解，但是相关术语可能会令人混淆。

02

8. 建立一个单一数字的评估指标

分类准确率是单一数字评估指标(single-number evaluation metric)的示例：你在你的开发集（或测试集）上运行你的分类器,然后得到样本分类正确的比例（fraction）（单个数字），根据这个指标，如果分类器A的准确率为97%，分类器B的准确率为90%，那么我们认为分类器A更好。相比之下，精度（查准率）（Precision）和召回率（查全率）（Recall）[3]就不是一个单一数字的评估指标：它给出两个数字来评估分类器。拥有多个评估指标使得算法之间的比较更加困难，假设你的算法表现如下：

建立一个单一数字的评估指标

8 建立一个单一数字的评估指标分类准确率是单一数字评估指标(single-number evaluation metric)的示例：你在你的开发集（或测试集）上运行你的分类器,然后得到样本分类正确的比例（fraction）（单个数字），根据这个指标，如果分类器A的准确率为97%，分类器B的准确率为90%，那么我们认为分类器A更好。相比之下，精度（查准率）（Precision）和召回率（查全率）（Recall）[3]就不是一个单一数字的评估指标：它给出两个数字来评估分类器。拥有多个评估指标使得算法之间的

01

把CNN里的乘法全部去掉会怎样？华为提出移动端部署神经网络新方法

深度学习模型，尤其是深度卷积神经网络（DCNN），在多个计算机视觉应用中获得很高的准确率。但是，在移动环境中部署时，高昂的计算成本和巨大的耗电量成为主要瓶颈。而大量使用乘法的卷积层和全连接层正是计算成本的主要贡献者。

01

把CNN里的乘法全部去掉会怎样？华为提出移动端部署神经网络新方法

深度学习模型，尤其是深度卷积神经网络（DCNN），在多个计算机视觉应用中获得很高的准确率。但是，在移动环境中部署时，高昂的计算成本和巨大的耗电量成为主要瓶颈。而大量使用乘法的卷积层和全连接层正是计算成本的主要贡献者。

02

关于机器学习，不可不知的15个概念

‍‍ 作者：布奇·昆托（Butch Quinto）来源：大数据DT（ID：hzdashuju）有监督学习有监督学习是利用训练数据集进行预测的机器学习任务。有监督学习可以分为分类和回归。回归用于预测“价格”“温度”或“距离”等连续值，而分类用于预测“是”或“否”、“垃圾邮件”或“非垃圾邮件”、“恶性”或“良性”等类别。分类包含三种类型的分类任务：二元分类、多类别分类和多标签分类。回归中包含线性回归和生存回归。无监督学习无监督学习是一种机器学习任务，它在不需要标记响应的情况下发现数据集中隐藏

02

计算机程序的思维逻辑 (5) - 小数计算为什么会出错？

违反直觉的事实计算机之所以叫"计算"机就是因为发明它主要是用来计算的，"计算"当然是它的特长，在大家的印象中，计算一定是非常准确的。但实际上，即使在一些非常基本的小数运算中，计算的结果也是不精确的。比如： float f = 0.1f*0.1f; System.out.println(f); 这个结果看上去，不言而喻，应该是0.01，但实际上，屏幕输出却是0.010000001，后面多了个1。看上去这么简单的运算，计算机怎么会出错了呢？简要答案实际上，不是运算本身会出错，而是计算机根本就不能

08

ECCV2020 | CPNDet：Anchor-free+两阶段目标检测思想，先找关键点再分类

论文地址：https://arxiv.org/abs/2007.13816.pdf

03

格物致知-Floating Point

之前陆陆续续写了很多架构、设计、思想、组织方向的文字，突然感觉到有些厌烦。因为笔者不断看到有些程序员“高谈阔论、指点江山”之余，各种定律、原则、思想似乎都能信手拈来侃侃而谈，辩论的场合就更喜欢扯这些大旗来佐证自己的"金身"。殊不知，这些人的底座脆弱到不堪一击，那些“拿来”的东西都是空中楼阁罢了。优秀程序员区别于其他的一项重要指标，就是基础知识的底蕴足够强大。靠看靠学靠实战靠日积月累，绝无捷径。

02

扒出了3867篇论文中的3万个基准测试结果，他们发现追求SOTA其实没什么意义

在基准数据集上比较模型性能是人工智能领域衡量和推动研究进展的重要方式之一。研究者通常基于模型在基准数据集上的一个或一组性能指标进行评估，虽然这样可以快速进行比较，但如果这些指标不能充分涵盖所有性能特征，就可能带来模型性能反映不充分的风险。

03

编码器计数原理与电机测速原理——多图解析

编码器，是一种用来测量机械旋转或位移的传感器。它能够测量机械部件在旋转或直线运动时的位移位置或速度等信息，并将其转换成一系列电信号。

03

吴恩达《ML Yearning》| 关于开发集、测试集的搭建

MachineLearning Yearning Sharing 是北京科技大学“机器学习研讨小组”旗下的文献翻译项目，其原文由Deep Learning.ai 公司的吴恩达博士进行撰写。本部分文献翻译工作旨在研讨小组内部交流，内容原创为吴恩达博士，学习小组成员只对文献内容进行翻译，对于翻译有误的部分，欢迎大家提出。欢迎大家一起努力学习、提高，共同进步！

01

机器学习 Fbeta-Measure 指标详解

为了让加深我们印象，这里我们把直接放上关于精确率和召回率的解释，如果大家忘记的话，以后不妨来多看看

02

卷爆了 | 看SPViT把Transformer结构剪成ResNet结构！！！

Vision Transformers吸引了大量的研究，并成为各种图像识别任务的Backbone之一，如分类、分割和检测。

05

程序员欢乐送（第38期）

原文链接：https://cuijiahua.com/blog/2019/10/life-46.html

01

J.Cheminform| MACCS密钥：在逆合成预测中弥补SMILES的局限性

今天给大家介绍的是韩国江原国立大学Umit V.等人在2021年发表的一篇名为“Substructure-based neural machine translation for retrosynthetic prediction”的文章。随着机器翻译方法的快速改进，神经网络机器翻译开始在逆合成规划中发挥重要作用。作者利用无模板的序列到序列模型，将逆合成规划问题重新转化为语言翻译问题，不像先前的使用SMILES字符串来表示反应物和产物的模型，作者引入了一种新的基于分子碎片的方法来表示化学反应，并使用古本系数进行结果评估。结果表明，与目前最先进的计算方法相比，该方法能获得更好的预测结果。该方法解决了现有的逆合成方法产生无效SMILES字符串等主要缺陷。具体来说，我们的方法预测高度相似的反应物分子的准确率为57.7%。此外，作者的方法得到了比现有方法更稳健的预测。

01

JCI｜基于子结构的神经机器翻译预测逆合成反应

2021年4月13日，Neves BJ等人在Journal of Cheminformatics杂志发表文章，文章使用分子指纹将分子表示为一段基于子结构的"句子"，通过学习子结构水平上的化学变化来预测逆合成反应。

02

ICML Workshop | NNCodec: 神经网络编码 ISO/IEC 标准的开源软件实现

人工智能方法在信号处理许多领域的普遍应用导致对底层神经网络（NN）的高效分配、训练、推理和存储的需求不断增加。为此，需要寻求有效的压缩方法，提供最小的编码率的同时，神经网络性能指标（例如分类精度）不会降低。

03

AI综述专栏| 大数据近似最近邻搜索哈希方法综述（上）（附PDF下载）

在科学研究中，从方法论上来讲，都应先见森林，再见树木。当前，人工智能科技迅猛发展，万木争荣，更应系统梳理脉络。为此，我们特别精选国内外优秀的综述论文，开辟“综述”专栏，敬请关注。

03

BRIEF描述子生成算法

一：介绍我们知道SIFT算法通常通过对每个关键点生成128个特征向量作为描述子、SURF算法通常对关键点生成最少64个特征向量作为描述子。但是对于图像来说创建上千或者上万个这样的描述子内存开销比较大，运行速度受到严重影响。特别对嵌入式设备与一定设备来说，内存限制尤为明显，而且匹配的时候计算也比较耗时。但是实际上这些特征数据OpenCV在匹配的时候并没有完全利用上，而是通过PCA、LDA等方法对它进行压缩，或者是LSH(局部敏感哈希)方法把这些特征描述子压缩从浮点数转换为二进制字符串，然后通过汉

06

干货 | 数据科学岗位必备面经：17个热点问题如何回答？（一）

AI科技评论按：随着数据科学成为炙手可热的领域，相关的应聘岗位也多了起来。面试者们在准备应聘的过程中，往往会有一个疑问：面试官们会问些什么？我又应该如何回答？ Gregory Piatetsky在KDnuggets上分享了17个紧跟热点的数据科学相关职位可能会接触的问题及答案。从AI未能正确预测2016年美国总统选举结果和第51届超级碗大逆转的经验教训，如何区分偏差和方差，预测变量数目越少越好，甚至到如何增强模型抵抗异常的鲁棒性都一应俱全，本文为第一部分，AI科技评论做了相关编译。去年，21个必知的数据科

08

南开大学提出新物体分割评价指标，相比经典指标错误率降低 69.23%

---- 新智元专栏作者：范登平（南开大学）【新智元导读】南开大学媒体计算实验室等研究团队从人类视觉系统对场景结构非常敏感的角度出发，提出一种新颖、高效且易于计算的结构性度量 (S-measure) 来评估非二进制前景图，进而使得评估不需要像传统AUC曲线那样通过繁琐且不可靠的多阈值化来计算精度、召回率，仅通过简单的计算(5.3ms)就可以得到非常可靠的评价结果，成为该领域第一个简单的专用评价指标。相关研究已被ICCV 2017录用为spotlight paper，第一作者南开大学博士生范登

08

额叶-小脑连接介导认知加工速度

加工速度是理解认知的重要概念。本研究旨在控制任务特异性，以了解认知加工速度背后的神经机制。对40名被试执行两种方式(听觉和视觉)和两种水平的任务规则(相容和不相容)的注意任务。block设计的功能磁共振成像在任务过程中捕捉到了BOLD信号。参考公开的用于处理速度的任务激活图，定义了13个感兴趣区域。认知速度是从任务反应时间得出的，这产生了六组连接性测量。混合效应LASSO回归显示，有六条重要路径提示了小脑-额叶网络预测认知速度。其中，3例为长程(2例额叶-小脑，1例小脑-额叶)，3例短程(额叶-额叶、小脑-小脑和小脑-丘脑)。长距离的连接可能与认知控制有关，而短距离的连接可能与基于规则的刺激-反应过程有关。揭示的神经网络表明，按照任务规则执行操作，自动性与自上而下努力控制注意力相互作用，解释了认知速度。 1 简述本研究旨在通过使用一系列简单的视觉和听觉通道的刺激-反应(S-R)映射任务来解决可能的任务相关偏差。这个多任务设计目的是解决上面提到的特定于形态和功能偏向的。箭头任务最初是一种视觉S-R兼容性任务，为了更好地控制所需的感觉运动处理时间，回答涉及到关于所看到或听到的内容的简单反应，箭头任务后来被改编成视觉和听觉形式(图1)。为了减少任务转换效应和交叉试验的不确定性，我们采用了分组设计，而不是与事件相关的设计。此外，我们的目标是解决以前的研究中的方法论缺陷，这些研究利用皮尔逊的相关性和心理生理学相互作用(PPI)来建立基于连接性的模型来预测加工速度。在这项研究中，我们建立了六个连通性指标，包括四个基于多变量的指数，用于进行模型比较。通过将控制任务的反应时与控制感觉运动成分的实验任务的反应时进行回归，构造了一个认知速度变量。功能关联性模型的建立基于混合效应套索回归。据我们所知，本文在该领域首次采用跨通道多任务设计，并比较了6种方法对区域间交互作用辅助处理速度的建模结果。 2 方法 2.1 被试从当地社区招募了40名年龄在18-28岁的健康年轻人参与研究。他们都有高中或以上学历。最终样本包括35名参与者(21.5±2.1岁，14名女性)，其中5名参与者被排除在分析之外。 2.2 处理速度任务箭头任务被用来测量加工速度。它包括一个双选择S-R映射任务，具有相容(COM)、不相容(INC)和简单RT控制条件(NEU)(图1)。在COM中，参与者在出现向上箭头时按下“向上”按钮，在出现向下箭头时按下“向下”按钮(图1)。在INC中，参与者按下“向上”键表示向下箭头，按“向下”键表示向上箭头。实验涉及参与者在观看一条没有箭头的垂直线时按下任何按钮。因为在这些条件下出现的刺激是视觉图像，所以它们被称为COMVIS、INC-VIS和NEU-VIS。相同条件的听觉版本是COM-AUD、INC-AUD和NEU-AUD，向上箭头、向下箭头和垂直线分别被高音、低音和中音代替。

01

比DNA存储更可怕！你的照片居然可以存储在氨基酸分子溶液里

上周，新智元报道了DNA数据存储的新闻，不仅16G的维基百科能够存储到一个DNA分子上，就连存储全球的数据也只需要1kg DNA。

01

Weka中分类器指标的说明

相关系数，相关性系数 (Correlation Coecient)是真实值a与预测值p之间的统计相关性，它是一个[-1,1]之间的实数。1表示完全相关，0表示完全不相关，-1表示反向完全相关。对一个数值预测模型，相关性系数越接近1表明预测能力越好，而其他误差相关的度量都是越小越接近0越好。均方误差是最常用的基本方法，程序中得不到，但是可以得到均方根误差。

03

如何让你的深度神经网络跑得更快

由于内存和计算能力有限，随着网络变得越来越深，对包括移动设备在内的有严格时延要求的有限资源平台而言，神经网络压缩就成为一个关键问题。就降低性能和加快深度网络之间达到平衡，引发了很多研究。本文将作为能够高效利用资源的深度网络的压缩、加速的引言介绍。

03

Iris: 比ScanContext更加精确高效的激光回环检测方法（IROS 2020）

代码已开源: https://github.com/JoestarK/LiDAR-Iris

02

训练深度学习神经网络的常用5个损失函数

神经网络在训练时的优化首先是对模型的当前状态进行误差估计，然后为了减少下一次评估的误差，需要使用一个能够表示错误函数对权重进行更新，这个函数被称为损失函数。

01

【教程】机器学习Python教程：2机器学习术语

这意味着分类器在42个案例中正确地预测了为男性，并错误地预测了8个男性案例为女性。它正确地预测了32例女性，18例被错误地预测为男性而不是女性。

02

由人工智能参数讨论基于Bug的软件测试质量分析

上文和大家一起讨论了人工智能样本的评价参数：准确度、精准度、召回率和F1分数。这篇文章，我们结合这些参数来讨论基于Bug的软件测试质量分析。

01

只使用Numpy手动实现多层卷积神经网络（详解）

AiTechYun 编辑：yuxiangyu 在过去，我曾写过一篇关于“理解在最大池化层和转置卷积的反向传播”的文章。现在我想要使用这些知识做一个多层（或者说多通道）的卷积神经网络。在阅读本文之前我建议你可以看一下下面两个链接的内容（都是探讨舍弃反向传播给人工智能找到新方向的）：链接1：https://www.quora.com/Why-is-Geoffrey-Hinton-suspicious-of-backpropagation-and-wants-AI-to-start-over 链接2：ht

08

身高2m，体重2kg，这样的数据“看上去很好”？

导读：数据挖掘算法通常用于为其他目的收集的数据，或者在收集时未明确其目的。因此，数据挖掘常常不能“在数据源头控制质量”。相比之下，统计学的实验设计或调查中，其数据质量往往都达到了一定的要求。由于无法避免数据质量问题，因此数据挖掘着眼于两个方面：

02

基于 FPGA 的数字表示

在FPGA系统中有两个基本准则非常重要，分别为：数字表示法和代数运算的实现。本博文主要介绍数字表示。参考文献：数字信号处理的FPGA实现(第3版)中文版 && 基于FPGA的数字信号处理 [高亚军编著] 2015年版可以购买相关书籍进行研读。

02

【干货】用神经网络识别歌曲流派（附代码）

DataSet: 本文使用GTZAN Genre Collection音乐数据集，地址:[1]

05

入门 | 机器学习模型的衡量不止准确率：还有精度和召回率

选自Medium 作者：William Koehrsen 机器之心编译参与：Nurhachu Null、刘晓坤我们倾向于使用准确率，是因为熟悉它的定义，而不是因为它是评估模型的最佳工具！精度（查准率）和召回率（查全率）等指标对衡量机器学习的模型性能是非常基本的，特别是在不平衡分布数据集的案例中，在周志华教授的「西瓜书」中就特别详细地介绍了这些概念。 GitHub 地址：https://github.com/WillKoehrsen/Data-Analysis/blob/master/recall_pre

05

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭