文章/答案/技术大牛

发布

社区首页 >问答首页 >Hyperopt与默认值

问Hyperopt与默认值
EN

Data Science用户

提问于 2019-05-27 23:52:48

回答 1查看 332关注 0票数 4

当我使用hyperopt库来调优随机森林分类器时，我得到了以下结果：

超选择估计最优{‘最大深度’：10.0，‘n_估值器’：300.0}

然而，当我使用默认的超参数来训练模型时，所有的评估指标(精度、召回、F1、iba、AUC)都会返回比调优模型更高的值。我还应该继续跟踪调优参数吗？或者忽略调优过程的结果，因为它无助于改进结果？

classification

random-forest

hyperparameter

回答 1

Data Science用户

发布于 2019-05-28 02:42:10

据我所知，你们过度抽样的做法(如评论中所述)是不正确的。当你在每一个折叠(假设K-折叠)上应用击击时，它会对少数族裔类进行过抽样。你总是会得到来自K折叠的混合响应，这不是K折叠验证的目的。

让我用一个例子来解释一下：

假设您有一个A、B、C和D类的数据集。
每个类别的样本，A类有10000，B有2000年，C有1000个，D有6000个。
在K折叠交叉验证过程中，由系统获取的样本用于大多数A和D类的培训。
而对于测试，它主要是B和C，因为您已经使用了SMOTE，它会对其他两个类进行过抽样，在这种情况下也会得到不错的结果。

注意:这可能是原因之一。

My suggestion:
 1. Shuffle the whole data set.
 2. Divide into training and test data.
 3. Apply SMOTE on training data.
 4. Follow other steps of Model training, without manipulating the data at this stage.
 5. Evaluate model on the actual test data.

票数 1

页面原文内容由Data Science提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://datascience.stackexchange.com/questions/52733

复制

相似问题

问Hyperopt与默认值
EN

回答 1

Data Science用户

注意:这可能是原因之一。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Hyperopt与默认值EN

回答 1

Data Science用户

注意:这可能是原因之一。

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Hyperopt与默认值
EN