我是从这来的,回答得很好。我遇到了许多使用交叉验证的方法,对所附问题的回答是迄今为止对我最好的解释。我的两难处境是,现在我无法弄清楚如何使用Kfold验证:-
也是怎么回事?我不知道在交叉val之后该如何处理平均分数,如何处理这些褶皱,以及如何处理对k-1倍的列车数据进行训练的模型?
发布于 2019-10-21 17:28:22
在回答“要做什么”的问题时,如果您使用了scikit-learn类(从sklearn.model_selection),您可以从它中获得以下内容:
我已经看到了一些在整个培训集上进行“手动”再培训的源代码,但是没有必要作为scikit--让我们访问整个火车组的改装模型:)
发布于 2019-10-21 13:03:48
交叉验证基本上用于超参数调整。
你训练了一套模型超参数设置,并以交叉验证的平均分数作为每个模型超参数设置的近似性能。然后,最高分数的模型超参数设置将是您的模型设置的选择。这种超参数设置可以被看作是从这种模型中得到的最好的。
稍后,可以使用此模型设置测试测试数据集上的一般性能。
https://datascience.stackexchange.com/questions/62026
复制相似问题