击上方
“蓝色字”
可关注我们!
今日分享:模型评估波士顿房价预测
一:流程
波士顿地区房价数据获取,数据来自于sklearn自带数据集;
波士顿地区房价数据分割;
训练与测试数据标准化处理;
使用最简单的线性回归模型LinearRegression和梯度下降估计SGDRegressor对房价进行预测
三:回归性能评价 -- 均方误差
(均方误差(MeanSquared Error)MSE)
括号中 前者为预测值,后者为平均值真实值
sklearn回归评估API
四:代码演示
输出结果
由输出结果对比两者的均方误差,该次运行结果SGD效果较好
需要注意的是
在数据量小的时候,往往正规方程的效果是比较好的,本次波士顿数据集有500+个样本,这数量很小,小编在运行的时候正规方程效果占上风的次数明显多于梯度下降;各位不妨找更大数据量的数据集来验证SGD的优越性。
线性回归是最为简单、易用的回归模型,但这一特点在某种程度上也限制了其适用范围,尽管如此,在不知道特征之间关系的前提下,我们仍然使用线性回归作为大多数业务的首要选择。
小规模数据:LinearRegression(不能解决拟合问题,后续会介绍优化的回归模型)以及其它;
大规模数据:SGDRegressor
公众号QQ群
扫QQ群二维码进交流学习群
领取专属 10元无门槛券
私享最新 技术干货