我使用不同的模型对测试集进行训练,并对测试集进行预测。共同点是,所有模型都低估了测试集上的真实值。我应该采取哪些步骤来理解原因?
发布于 2016-10-18 06:11:56
欢迎来到数据科学。你的模型似乎倾向于对真实值的较低估计。这种情况的发生有多种原因。假设你试图在由二次多项式生成的数据上拟合一条直线。直线配合将有一个偏差。通常,偏差的发生是因为您试图构建的模型不足以捕获您试图将其安装在其上的数据的动态。我知道这是非常通用的,但如果没有更多关于您使用的模型或测试集的任何细节的信息,就很难为您提供更多的帮助。
https://datascience.stackexchange.com/questions/14602
复制相似问题