前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >模型评估1(误差、偏差、方差)

模型评估1(误差、偏差、方差)

作者头像
用户5745385
发布2019-07-04 12:28:41
1.4K0
发布2019-07-04 12:28:41
举报
文章被收录于专栏:XSYMambaXSYMamba

一、概念

1、方差:是模型每一次输出结果与模型输出期望之间的误差,即模型的稳定性。描述数据离散程度,数据波动性,会影响模型的预测结果。

示例:每个班成绩数据方差不一样,即每个班数据与均值间的差异大小,是都在平均值范围,还是极端高和极端低。

2、偏差:预测值和真实值之间的差距,针对样本数据。偏差越大,越偏离真实数据集。用来衡量测定结果的精密度高低。

示例:用每个人不同次语文考试成绩的平均值来合真实值的差别。

四张图:

解释:

左上:低偏差,低方差。预测准确到高,模型很稳定,数据集中。(理想模型)

右上:低偏差,高方差。预测结果较准确,模型不稳定,数据波动影响预测结果,数据分散。

左下:高偏差,低方差。预测结果不准确,模型稳定,数据集中。

右下:高方差,高偏差。预测结果不准确,模型不稳定,数据分散

3、噪声:任何学习算法在泛化能力的下界,和预测结果不一致的数据点,但与最终结果不一致,无法通过模型降低。

示例:KNN中,k选取10,8个为A类,2个为B类,这2个为噪声点

4、误差:误差反映的是模型整体精准度

方差 + 偏差 + 噪声

5、协方差:衡量两个变量的总体误差。而方差是协方差的一种特殊情况,即当两个变量是相同的情况。

二、区别

1、误差、方差、偏差、噪声

误差:整个模型的准确度,以真实值为标准。

方差:模型间差异,随着数据量增加,模型是否稳定。

偏差:预测值和数据之间差异,以多次测量结果的平均值为标准。描述训练数据和模型的匹配度。

噪声:预测结果间差异,算法可以接受的不确定数据的范围比例或程度。

2、方差、偏差与过拟合、欠拟合关系

欠拟合: 模型在训练和预测时表现都不好的情况

过拟合: 训练数据模型预测精确(含噪声),但测试数据不精确

名称 欠拟合 过拟合

方差( 训练数据) 小 小

偏差(训练数据) 大 小

方差(测试数据) 小 大

偏差(测试数据) 大 小

图:

图1:偏差最大 ,方差最小

图4:偏差最小 ,方差最大

3、与模型复杂度关系

越复杂的模型,偏差越小,方差越大,会出现过拟合

参数少简单模型,会得到低方差,高偏差,会出现欠拟合

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-04-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 XSYMamba 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档