我有一个不平衡的数据集,我正在尝试进行二进制分类。最后,我使用了几种算法,CatBoostClassifier
和lightgbm
给了我比较好的结果。关于classification_report
和confusion_matrix
,我有一个问题要问。
从我的classification_report
:-True Negatives
:1076,-False Positives
:0,-False Negatives
:1,-True Positives
:6可以看出。
Sensitivity
:0.86和Specificity
1.00,这意味着我的false positive rate
为0.0。
我认为它确实表现得很好。
从classification_report
中,它是否告诉你,我的模型可能已经安装过了,或者它确实表现得很好?
我之所以这样问,是因为1
类的1
(数量较少)是7,而0
类是1076。
link说:“支持的是该类中真正响应的样本数。”但我不太明白重点。
有人能向我解释,或者让我知道我的算法是否太适合或者表现得很好吗?
标签比率:
0 5550
1 60
分类报告
precision recall f1-score support
0.0 1.00 1.00 1.00 1076
1.0 1.00 0.86 0.92 7
accuracy 1.00 1083
macro avg 1.00 0.93 0.96 1083
weighted avg 1.00 1.00 1.00 1083
混淆矩阵:
[[1076 0]
[ 1 6]]
发布于 2020-11-30 04:30:47
如果你同时看一看训练集和测试集的分类报告,你就能更好地理解事情,你不能说任何事情,只看训练集的性能,或者单独看火车组。但是,如果我们假设您在这里展示的性能度量是针对测试集的,并且火车组的性能与您在测试集中观察到的性能大致相同,那么我想说,这个模型做得很好。对于类1
的回忆是86%
,因为它只形成了数据集的1%
这一事实非常好。
此外,支持是指数据集中属于特定类的示例总数,例如,在您的示例中,对类0
的支持是5550
,对类1
的支持是60
。
https://stackoverflow.com/questions/65072978
复制相似问题