如果我错了,请纠正我。“训练集用于计算机器学习模型的参数,验证数据用于计算同一模型的超参数(我们使用相同的权重,不同的超参数),测试集用于评估我们的模型”。如果是真的,有人能更详细地解释一下整个过程吗?蒂娅。
发布于 2018-06-07 06:44:43
假设你在70%的数据上训练你的随机森林分类器,那么它将帮助你的分类器从这个训练数据中识别出随机森林分类器的有用属性或特征。但是,随机森林分类器的深度等超参数很多,影响了RF分类器的性能。您可以通过在验证集上绘制精度图(例如,数据的另外10% )来检查哪个深度为您提供了最佳性能。在训练并找到正确的超参数值后,您可以在测试数据(剩余20%的数据)上测试分类器的性能。
https://stackoverflow.com/questions/50730555
复制相似问题