我有一个回归模型,其中我的目标变量(天)数量值在2到30之间。我的RMSE是2.5,所有其他X变量(名义)都是分类的,因此我对它们进行了虚拟编码。我想知道RMSE的好值是什么?我想要得到1-1.5甚至更少的东西,但我不知道我应该做什么来实现同样的目标。
Note#我已经尝试过功能选择,删除功能将不那么重要。
任何想法都将不胜感激。
发布于 2019-03-05 08:50:41
如果你的x值是绝对的,那么将它们绑定到一个统一的网格就不一定有多大意义。谁说A类和B类应该像B和C一样隔开,假设它们是一样的,只会导致不正确的结果表示。
由于您选择的尺度是未知数,因此在可视化方面,最好将均匀的x网格设置为天数,然后查看类别在y尺度上的位置(如果给定线性关系)。
如果你没有x和y的定量数据,均方根误差就不会出现在其中。
https://stackoverflow.com/questions/54993739
复制相似问题