我一遍遍的记起却又一次次的忘记,时而混淆时而模糊
—公式太难了
交叉表
真实情况里面2种样本
正例、反例
预测结果里面2种结果
预测为正例、预测为反例
完美模型能将正样本预测为正例
负样本能预测为反例
实际情况有的正样本会被预测为反例
负样本会被预测为正例
二者交叉得到四种结果,如下交叉表
公式
精准率
How many selected items are relevant?
针对预测结果
预测为正的样本里有多少正样本
正样本和父样本都可能会被预测为正
预测为正的样本 =
被正确预测为正的正样本(TP)+
被错误预测为正的负样本(FP)
召回率
How many relevant items are selected?
针对原有样本
正样本里面有多少被正确预测
正样本会被预测为正
也会被预测为负
正样本 =
被正确预测为正的正样本(TP) +
被错误预测为负的正样本(FN)
难点
Q1:
我记不住TP FN FP TN
T和F 代表着预测正确和预测错误
P和N 英文单词positive和negative,翻译过来是阳性和阴性,也叫正和反,相关和不相关等
很容易绕来绕去的原因就是所以TP FN等都是组合意思,规则就是 预测正确性+预测分类,需要转换成真实和预测。
TP:预测正确+预测阳 = 原有阳 预测阳
FN:预测错误+预测阴 = 原有阳 预测阴
FP:预测错误+预测阳 = 原有阴 预测阳
TN:预测正确+预测阴 = 原有阴 预测阴
总结:需要转换成真实和预测,才能更好的理解。
Q2:
精准率和召回率的公式很容易混
Q3:
精准率和准确率是否一样
不一样。