ROC 曲线,作为评价机器学习模型敏感度的一条重要曲线,在分类任务评价机制中应用较多。
但是很多朋友对于 ROC 曲线的理解还是有些模糊,心想着 x 轴是 , y 轴是 , 组条曲线有些神秘。
今天,咱们用 4 个样本,使用逻辑回归,分类阈值分别从 0.,0.2,0.4,0.6,0.8,1.0,依次变化,分别求出对应分类阈值的 FRP 和 TPR 值。
这样不就得到 6 个 (FRP,TPR) 点,组个曲线,不就是 ROC 曲线吗!
计算公式:
使用逻辑回归 Logistic regression,得到 4 个样本的概率分布为:[0.8,0.6,0.4,0.2]
当分类阈值参数 alpha 为 0.0 时:
结果:
当分类阈值参数 alpha 为 0.2 时:
结果:
当分类阈值参数 alpha 为 0.4 时:
结果:
当分类阈值参数 alpha 为 0.6 时:
结果:
当分类阈值参数 alpha 为 0.8 时:
结果:
当分类阈值参数 alpha 为 1.0 时:
结果:
绘制以上 6 个点,得到 ROC 曲线:
原创不易,点个在看
领取专属 10元无门槛券
私享最新 技术干货