为什么在模型训练过程中选择的超参数与来自重采样的超参数不同？_如何使用pytorch动态图属性来并行训练具有不同超参数的模型？ - 腾讯云开发者社区

r、mlr3

在重采样期间，将测试值为5和9的max_depth参数。然而，在训练时，使用了完全不同的值10。我预计在训练过程中会设置返回最小RMSE的参数。在本例中，选择了一个完全不同的参数值。

浏览 23提问于2019-10-11得票数 1

回答已采纳

1回答

理解机器学习的交叉验证

python、validation、data-science、cross-validation

下列有关交叉验证的内容是否正确？：将训练数据分成不同的组，除一个训练数据集外，所有训练数据集都用于训练模型。一旦对模型进行了训练，就会使用“遗漏”训练数据来执行超参数调优。一旦选择了最优的超参数，将测试数据应用到模型中，给出一个结果，然后将其与</

浏览 1提问于2020-09-21得票数 0

回答已采纳

2回答

数据集随机样本上超参数整定的缺点

machine-learning、bigdata、sampling、hyperparameter-tuning

我经常使用非常大的数据集，在构建机器学习模型时检查所有相关的超参数组合是不切实际的。我正在考虑随机采样数据集，然后使用该示例执行超参数调优。然后，我将使用所选的超参数使用完整的数据集来训练/测试模型。这种方法的缺点是什么？

浏览 0提问于2019-01-16得票数 1

回答已采纳

1回答

随机森林库:R和Python的不同结果

python、r、random-forest

下面的代码在R和python中训练随机森林模型。正如您注意到的，R (1-0.27=0.73)比Python (0.69)更准确。此外，在R和Python中，特性的重要性是不同的。编辑有在python中复制R结果的方法吗，或者有些事情是失控的？两个库中的一些可调参数是不同的，这使得很难进行匹配。是否还有其他人从Pyhton和R

浏览 3提问于2017-10-31得票数 0

2回答

为什么超参数调优发生在验证数据集上，而不是在一开始？

machine-learning、deep-learning、neural-network、hyperparameter-tuning、hyperparameter

尽管做了/使用过几次，但我仍然对使用验证集进行超参数调优感到有点困惑。据我所知，我选择一个模型，对训练数据进行训练，对训练数据进行性能评估，然后对验证数据进行超参数整定评估模型性能，然后选择最佳模型并对测试数据进行测试。为了做到这一点，我基本上需要随机选择一个模型来训练数据。我不明白的</em

浏览 0提问于2022-05-28得票数 0

1回答

n_jobs=-1还是n_jobs=1？

cross-validation、hyperparameter-tuning、gridsearchcv、model-evaluations

对于某些模型和简历中使用的n_jobs参数，我感到困惑。我知道它用于并行计算，其中包括n_jobs参数中指定的处理器数。因此，如果我将值设置为-1，它将包括所有内核及其线程，以加快计算速度。但这篇文章：- 使用所有核心来进行训练、评估和超</em

浏览 0提问于2021-07-23得票数 1

回答已采纳

1回答

整个模型开发过程的优化

machine-learning、hyperparameter-tuning、pipelines、kedro

我想对整个模型开发管道执行全局优化。我有几个开发阶段，每个阶段都可以自动执行:预处理，去除异常/异常，过采样，特征选择，超参数调整。这些步骤中的每一个都有许多不同的实现。也就是说，可以通过数十种不同的算法来消除异常，等等，可以重复各个阶段。例如，您可以调优超参数，删除10%未使用的函数，重复对超参数<

浏览 0提问于2022-12-11得票数 0

1回答

对我正在使用的LSTM超参数整定过程的看法

keras、lstm、hyperparameter-tuning、bayesian、epochs

我正在训练一个LSTM来预测价格图表。我使用贝叶斯优化来稍微加快速度，因为我有大量的超参数，并且只有我的CPU作为资源。从超参数空间进行100次迭代，当训练仍然花费了太多的时间才能找到一组合适的超参数时，每一次迭代都要经历100次。我的想法是这样。如果在贝叶斯优化过程中，我只训练了一个时代，

浏览 0提问于2020-05-05得票数 2

回答已采纳

1回答

调整svm和cart超参数

r、decision-trees、svm、hyperparameter-tuning

我试图用e1071 R软件包的but ()函数来优化支持向量机和CART的超参数，但我有一个疑问。我应该调整训练数据上的参数，在训练数据上拟合模型，然后在测试数据上测试它，还是可以避免第二步？

浏览 0提问于2018-10-05得票数 1

回答已采纳

1回答

如何预测`tune_nested`之后的新数据集？

mlr3

cv", folds = 3), term_evals = 10,)new_data = as.data.table(task)[1:10,] 如何预测new_data的结果？

浏览 4提问于2022-02-18得票数 1

1回答

如何在nnet中使用大小和衰减

r、nnet

我对神经网络世界还很陌生，所以我请求您的理解。我正在生成一些测试，因此我有一个关于参数size和decay的问题。我使用caret包和nnet方法。首先，这是使用插入符号使用nnet方法的最好方法吗？)，但我不明白如何在实践中使用它们。有人能帮上忙吗？

浏览 1提问于2017-02-23得票数 9

回答已采纳

1回答

梯度下降和网格搜索在机器学习中的区别是什么？

machine-learning、gradient-descent、grid-search

超参数优化使用两种技术，如网格搜索、或随机搜索。梯度下降主要用于将损失函数降到最小。这里查询是在什么时候我们将使用网格搜索和梯度下降。

浏览 1提问于2019-02-10得票数 2

1回答

目标函数与评价指标的匹配

xgboost、loss-function、model-evaluations、mse

模型拟合的目标函数和模型验证的评价指标是否需要在整个超参数搜索过程中保持一致？例如，一个XGBoost模型是否可以以均方误差作为目标函数(将“目标”参数设置为reg: squared :回归和平方损失)，而交叉验证过程是基于显著不同的度量来评估的，例如伽马偏差(伽马回归的剩余偏差或者评价指标应该尽可能地与目标函数相匹配，因此需要

浏览 0提问于2020-09-25得票数 3

回答已采纳

3回答

为什么不在火车数据集上优化超参数呢？

machine-learning、neural-network、training-data

在开发神经网络时，通常会将训练数据划分为列车、测试和保留数据集(许多人将这些数据分别称为列车、验证和测试)。同样的东西，不同的名字)。许多人建议根据测试数据集中的性能选择超参数。我的问题是:为什么？为什么不在列车数据集中最大限度地提高超参数的性能，当我们通过测试数据集中的性能下降检测到过度拟合时，停止对超<em

浏览 1提问于2016-07-05得票数 5

回答已采纳

1回答

如何在交叉验证中选择参数？

machine-learning、training、cross-validation、hyperparameter-tuning、parameter-estimation

假设我正在使用K折叠交叉验证K折叠交叉验证训练一个线性回归模型。我每次用不同的训练和测试数据集训练K次。因此，每次我训练时，都会得到不同的参数(线性回归情况下的特征系数)。因此，在交叉验证结束时，我将得到K个参数。如何得出我的模型的最终参数？如果我也使用它来调优超<

浏览 0提问于2022-05-19得票数 3

2回答

需要在KNN中进行交叉验证

cross-validation、k-nn

我读到在KNN算法中我们需要交叉验证，因为我们从KNN的训练测试中发现的K值可能无法对未见数据进行泛化。给出的逻辑是，在求K值时使用测试数据集，因此KNN-算法具有测试数据集的信息，因为K是通过测试数据集发现的。这和看不见的数据不一样。但是是的，K值是从测试数据集中找到的，因此我们得到了我们的KNN算法，但是对测试数据的测试是在不知道测试数据的情

浏览 0提问于2022-01-09得票数 0

2回答

为什么同时使用验证集和测试集？

machine-learning、neural-network、cross-validation

考虑一个神经网络：测试集上的错误不是和验证集有点相同吗?对于网络来说，它是一个看不见的数据，就像验证集一样，它们的数量也是相同的吗？相反，我们不能通过将测试集合并到它来增加<em

浏览 0提问于2017-04-13得票数 36

回答已采纳

1回答

偏差-方差权衡与模型评估

machine-learning、model-evaluations

假设我们已经训练了一个模型(由它的超参数定义)，并使用某种性能度量(比如R^2)在测试集上对它进行了评估。如果我们现在在不同的训练数据上训练相同的模型(由它的超参数定义)，我们将得到(可能) R^2的不同值。如果R^2依赖于训练集，那么我们将获得R^2平均值附近的<

浏览 0提问于2022-04-14得票数 1

1回答

如何量化培训的“计算成本”？

machine-learning、xgboost、hyperparameter-tuning

我想量化超参数搜索xgboost模型的计算成本。一种方法是使用特定的超参数配置来测量训练时间，并将其作为计算成本的代理。我们可以根据所选择的超参数的值来量化计算成本吗?例如，基于最大深度的解析表达式、估计量的数值、最小子体重、伽马等，或者你能提出一些其他方法来</em

浏览 0提问于2020-10-18得票数 1

1回答

多类分类与log_loss

classification、scikit-learn、loss-function、f1score

我有一个16K的文本列表，标签超过30个不同的类别，通过不同的分类器；我的预测和地面真相匹配，平均为94%。我现在正在测量一些额外的东西(但不确定我应该在F1_score最小值的基础上测量什么，因为我还在学习)，我从sklearn中碰到了log_loss，因此我理解它在0到1之间。我已经研究了ComplementNB.predict_proba的结果，它是log_loss所需的，其值与我的预测数组中

浏览 0提问于2020-09-05得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云