,不是垃圾邮件.为正样本,是垃圾邮件为负样本
我们一般使用四个符号表示预测的所有情况:
TP(真阳性):正样本被正确预测为正样本,例子中的60
FP(假阳性):负样本被错误预测为正样本,例子中的10
TN...(真阴性):负样本被正确预测为负样本,例子中的25
FN(假阴性):正样本被错误预测为负样本,例子中的5
----
1.评价方法介绍
先看最终的计算公式:
?...例子解释:对上前面例子,关注的部分就是预测结果的70封不是垃圾邮件中真实不是垃圾邮件占该预测结果的比率,现在Precision=60/(600+10)=85.71%
3.Recall(召回率)
关注真实正样本的数据...(不包含任何负样本)中,正确预测的比例
计算公式
?...,Recall在F-score计算中的权重,取值情况有以下三种:
如果取1,表示Precision与Recall一样重要
如果取小于1,表示Precision比Recall重要
如果取大于1,表示Recall