前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >分类模型的评估指标 | 混淆矩阵(1)

分类模型的评估指标 | 混淆矩阵(1)

作者头像
GIS与遥感开发平台
发布2022-04-29 09:15:14
7020
发布2022-04-29 09:15:14
举报
文章被收录于专栏:GIS与遥感开发平台

写在前面的话

最近小编分享的都是较为基础的操作方法或理论知识,且都总结在这个专辑中,目的是帮助初学GIS和RS的小伙伴们加深对一些专业名词知识的理解,熟悉一些基础操作的操作流程。而不是像小编大一时,面对这些专业性极强的东西两眼一抹黑,学习的很吃力;此外,基础是延伸和扩展的前提,基础的东西如果掌握的不牢靠,那么在前沿事物的钻研过程中也不会取得更大的建树。因此,小编分享这些基础知识,既是对初学者的帮助,也是对自己的巩固与总结。

最近几期,小编会给大家分享一个有意思,且实用的东西——分类模型的评估指标。

分类模型的评估指标有很多,今天小编给大家准备的是混淆矩阵。

简介

首先我们来解释一下什么是分类模型的评估指标。

分类模型,也可称为分类器,即一个可以经过训练,实现将数据集合中的所有元素分配给一个现有类别的模型。

评估指标,即评估分类模型所能实现的分类结果质量高低的指标。其有两种表现形式:定量指标和图表指标;定量指标即以具体数值来表示分类质量;图表指标即以图表的形式来表示分类质量,以达到增强可视化评估的效果。

我们今天介绍的混淆矩阵就是一个图表形式的指标。

基础知识

01

样本一级指标

一级指标分为以上四类:

TP:模型预测值为正,真实情况亦为正的样本数量;

FP:模型预测值为正,但真实情况为负的样本数量,亦称误报,是统计学中的第一类错误;

FN:模型预测值为负,但真实情况为正的样本数量,亦称漏报,是统计学中的第二类错误;

TN:模型预测值为负,真实情况亦为负的样本数量。

由以上内容可以获得结论:对于一款分类模型,TP值与TN值的数量越多,FP值与FN值的数量越少,模型的分类精度就越高。

02

样本二级指标

混淆矩阵统计的是样本在各个一级指标的数量。但是当样本数量过于庞大时,我们就很难再通过一级指标的数目进行明显的分析了,这时我们就引入了基于一级指标计算得来的二级指标:

准确率(Accuracy):在整个模型中,所有判断正确的结果占总样本数量的比重,即:(TP+TN)/(TP+FP+FN+TN)

精确率(Precision):在模型预测为正的结果中,模型预测对的数量所占的比重,即:TP/(TP+FP)

灵敏度(Sensitivity)【召回率(Recall)】:在所有真实值是正的结果中,模型预测对的数量所占比重,即:TP/(TP+FN)

特异度(Specificity):在所有真实值是负的结果中,模型预测对的数量所占比重,即:TN/(FP+TN)

由以上内容可知,我们可以通过二级指标,将单纯的数目结果归纳为几个百分比比率,这样就更加便于比较。

03

样本三级指标

在二级指标的基础上,利用精确率和灵敏度(召回率)可得到第三个指标——F1 Score。

F1 Score=2PR/(P+R),取值范围为(0,1),越接近1代表模型的精度越高。

04

小栗子

之前我们解释概念时是以两个类别展示的,下面我们以三个类别进行进一步深入的理解。

以A类为例:

1

---一级指标

TP值,即预测为A,真实就是A的样本数量,为20;

FP值,即预测为A,真实却不是A 的样本数量,即10+10=20;

FN值,即预测不是A,但实际情况就是A的样本数量,即5+2=7;

TN值,即预测不是A,实际情况也不是A的样本数量,即10+15+10+18=53。

2

---二级指标

准确率:(TP+TN)/(TP+TN+FP+FN)=(20+53)/(20+20+7+53)=73%

精确率:TP/(TP+FP)=20/(20+20)=50%

灵敏度(召回率):TP/(TP+FN)=20/(20+7)≈74%

特异度:TN/(TN+FP)=53/(53+20)≈73%

3

---三级指标

F1 Score=2PR/(P+R)=(2*0.5*0.74)/(0.5+0.74) ≈0.6

以上就是在机器学习领域中的混淆矩阵及它所引申出的几个评估指标。下一期我们会将其具体到遥感影像的分类中,其评估指标又会有所不同。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 GIS与遥感开发平台 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档