首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >不平衡类classification_report支持值的表示

不平衡类classification_report支持值的表示
EN

Stack Overflow用户
提问于 2020-11-30 11:47:05
回答 1查看 602关注 0票数 0

我有一个不平衡的数据集,我正在尝试进行二进制分类。最后,我使用了几种算法,CatBoostClassifierlightgbm给了我比较好的结果。关于classification_reportconfusion_matrix,我有一个问题要问。

从我的classification_report:-True Negatives:1076,-False Positives:0,-False Negatives:1,-True Positives:6可以看出。

Sensitivity:0.86和Specificity 1.00,这意味着我的false positive rate为0.0。

我认为它确实表现得很好。

classification_report中,它是否告诉你,我的模型可能已经安装过了,或者它确实表现得很好?

我之所以这样问,是因为1类的1(数量较少)是7,而0类是1076。

link说:“支持的是该类中真正响应的样本数。”但我不太明白重点。

有人能向我解释,或者让我知道我的算法是否太适合或者表现得很好吗?

标签比率:

代码语言:javascript
运行
复制
0    5550
1      60

分类报告

代码语言:javascript
运行
复制
              precision    recall  f1-score   support

         0.0       1.00      1.00      1.00      1076
         1.0       1.00      0.86      0.92         7

    accuracy                           1.00      1083
   macro avg       1.00      0.93      0.96      1083
weighted avg       1.00      1.00      1.00      1083

混淆矩阵:

代码语言:javascript
运行
复制
[[1076    0]
 [   1    6]]
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2020-11-30 12:30:47

如果你同时看一看训练集和测试集的分类报告,你就能更好地理解事情,你不能说任何事情,只看训练集的性能,或者单独看火车组。但是,如果我们假设您在这里展示的性能度量是针对测试集的,并且火车组的性能与您在测试集中观察到的性能大致相同,那么我想说,这个模型做得很好。对于类1的回忆是86%,因为它只形成了数据集的1%这一事实非常好。

此外,支持是指数据集中属于特定类的示例总数,例如,在您的示例中,对类0的支持是5550,对类1的支持是60

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/65072978

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档