我正在使用机器学习算法线性回归来预测房地产销售价格的值,并将销售价格作为我的目标变量。.But销售价格中有15%的空值,所以我可以使用这15 %作为我的测试集和非空值作为我的训练集吗?
发布于 2019-05-31 06:43:04
是的,您可以这样做,但由于您没有该测试集的实际值,您将无法评估您的模型的性能。将不会有任何可供评估的事实。我建议在80-10-10拆分中使用非空数据,用于训练验证测试和检查准确性。如果精度较高,则使用此模型预测空值,然后使用整个非空值数据进行训练,然后使用该模型再次预测空值数据。然后评估来自两者的预测,您将获得完美的评估和结果。
https://stackoverflow.com/questions/56384547
复制相似问题