当我使用hyperopt库来调优随机森林分类器时,我得到了以下结果:
超选择估计最优{‘最大深度’:10.0,‘n_估值器’:300.0}
然而,当我使用默认的超参数来训练模型时,所有的评估指标(精度、召回、F1、iba、AUC)都会返回比调优模型更高的值。我还应该继续跟踪调优参数吗?或者忽略调优过程的结果,因为它无助于改进结果?
发布于 2019-05-28 02:42:10
据我所知,你们过度抽样的做法(如评论中所述)是不正确的。当你在每一个折叠(假设K-折叠)上应用击击时,它会对少数族裔类进行过抽样。你总是会得到来自K折叠的混合响应,这不是K折叠验证的目的。
让我用一个例子来解释一下:
My suggestion:
1. Shuffle the whole data set.
2. Divide into training and test data.
3. Apply SMOTE on training data.
4. Follow other steps of Model training, without manipulating the data at this stage.
5. Evaluate model on the actual test data.
https://datascience.stackexchange.com/questions/52733
复制相似问题