如何使用样本权重进行交叉验证？

、、

我想执行交叉验证，以比较几个具有样本权重的模型。对于每个模型，我可以像这样设置一个参数。我如何通过交叉验证来做到这一点？

浏览 33提问于2021-08-01得票数 1

回答已采纳

3回答

scikit中的样本权重-在交叉验证中学习失败

、、

在训练随机森林分类器时，我一直在尝试使用scikit-learn中的加权样本。，我遇到了麻烦：grid_search = GridSearchCV(RandomForestClassifier(), params, n_jobs=-1, 问题是，交叉验证器不知道样本权

浏览 1提问于2014-02-20得票数 16

1回答

如何在GaussianNB和KNeighborsRegressor中使用类权重？

、、、

我成功地使用logistic回归和随机森林来使用类权重从cross_val_predict中获得结果。然而，对于KNN和NB，它在文档中说，对于这一点，我可以使用包含样本权重的fit：所以我想通过计算类权重来解决这个问题，并根据样本的分类来创建一个样本权重数组if y[i]==False:

浏览 2提问于2020-06-17得票数 2

1回答

XGBRegressor与权重和base_margin:样本外验证可能吗？

、、、

我有一个旧的线性模型，我希望改进使用XGBoost。我有旧模型的预测，我希望用它作为基数。此外，由于我建模的本质，我需要使用权重。在对新的XGBoost模型进行数据培训时，我会这样做： xgb_model = xgb.XGBRegressor(n_estimators=25,但是，当我需要指定权重和基准裕度时，如何进行交叉验证或样本外分析？据我所见，我可以使用sklearn和GridSearchCV

浏览 3提问于2022-06-06得票数 5

回答已采纳

1回答

LibSVM:交叉验证和测试时的-wi选项(权重选择)

、

我需要关于libSVM的权重选项的帮助。在某种程度上，我感到困惑；我们是否应该在进行交叉验证时也使用-wi选项？如果是这样，我们应该使用整个数据的计算权重还是根据v-1子集计算的权重(用于v折叠交叉验证)？我的第二个问题是，我们应该在预测时使用-wi选项吗？如果是这样，我们是应该在训练过程中使用计算的权重，还是应该根据测试数据中负实例和正实例的分布来计算权

浏览 1提问于2011-12-18得票数 4

1回答

在多层感知器中进行交叉验证时，我要初始化哪些模型？

、、、

因此，据我所知，交叉验证是用来确定最佳模型的。假设我使用的是5倍交叉验证，这意味着我必须制作5种不同的模型，但是，如何进行这些单独模型的培训呢？(随机权重？) 在

浏览 0提问于2018-09-29得票数 1

回答已采纳

2回答

如何交叉验证高度不平衡的数据集的深度学习模型？

、、、、

我有三个不同班级的1000、5000和10000个样本。我想做一个五倍交叉验证，以选择最好的预培训深入学习模式的部署。我包括在模型训练期间的课堂重量，以便给较少发音的课程更多的权重。对于给定的折叠，我将使用这三个类的200、1000和2000样本进行验证。在这种情况下，精确性是一个很好的预测手段吗？或者我也要测量F1分数和马修斯相关系数？我做得对吗？

浏览 0提问于2018-01-26得票数 3

回答已采纳

1回答

在Matlab中使用lasso的左一出回归

、、、、

我有300个数据样本，每个样本大约有4000维特征。每个输入有一个5模糊。输出在-2到2的范围内。我正试着把套索模型放进去。我浏览了几篇关于交叉验证策略的文章，比如：但是我在Matlab！我如何使用交叉验证来训练一个模型，并在我的数据集上使用lasso来拟合一个模型？我试着用matlab来做这件事。我想得到一套权重，我将能够用于未来的预测对其他数据。我尝试使用glmnet：，但由于缺少适当的mex

浏览 0提问于2014-04-14得票数 1

回答已采纳

1回答

R H20 -分层抽样和非I.D.交叉验证。行

、、

我正在使用H2O来分析数据集，但我不知道如何正确地对数据集执行交叉验证。我有一个不平衡的数据集，所以我希望执行分层交叉验证(如果输出变量用于平衡每个分区上的组)。然而，最重要的是，我还有一个问题，就是我的许多行都是重复的(一种实现权重而不实际拥有权重的方法)。除了这个问题的来源之外，我以前也看到过，在某些情况下，如果某些行必须保持在一起，则可以进行交叉验证。但是，两者不能同时进行吗

浏览 2提问于2019-01-02得票数 0

回答已采纳

6回答

Weka中的交叉验证

、、

从我所读到的情况来看，我一直认为交叉验证是这样执行的：在k次交叉验证中，将原始样本随机分成k个子样本.在k个子样本中，保留一个子样本作为模型测试的验证数据，其余的k−1子样本作为训练数据。然后交叉验证过程被重复k次(褶皱)，每个k个子样本精确地使用一次作为验证数据。从褶皱中得到的k值可以被平均(或以其他方式组合)来产生一个单一

浏览 8提问于2012-05-03得票数 29

回答已采纳

1回答

在scikit中class_weight参数是做什么的-学习SGD

、、

我是一个经常使用scikit-学习，我想了解一些关于“class_权重”参数与SGD。如果是的话，那么它是如何做到的。我的意思是，它是应用于特征惩罚，还是它是一个权重的优化功能。我怎么能向外行解释这件事？

浏览 2提问于2015-03-19得票数 2

1回答

您在sklearn方法cross_val_score中传递的cv参数是什么？

、、

在sklearn中，有一种称为cross_val_score的交叉验证方法。该方法的参数之一是“cv”。那么，这是不是cv = k，也就是将训练数据除以的子<e

浏览 0提问于2018-01-15得票数 1

回答已采纳

2回答

以假阴性为代价对机器学习预测进行加权

、、

我如何简单地合并这种错误成本。我不想重新训练模型，只有RF/SVM可用。

浏览 0提问于2013-09-15得票数 1

1回答

如何让ANN产生完全不同的结果？

、、、、

我正在尝试训练一个人工神经网络，我知道之前有人问过这个问题，为什么结果会不同，答案是权重的初始化是随机的。我在想一种方法是锁定随机种子，但我担心如果我锁定随机种子并以这种方式进行调整，这将取决于我是否选择了一个好的种子，它能够找到一个绝对最小值。那么前进的方法是只运行几次并找到最佳结果范围，然后使用这些权重吗？(如果是这样的话，有没有人知道怎么做？我正在通过sklearn包装器KerasRegressor使用Keras ) 任何帮助都将不胜感激。如果需要，我很乐意提供代码示例！

浏览 16提问于2019-08-28得票数 0

2回答

验证集是否用于更新神经网络？

、、、、

我有个神经网络的问题但是我听说把验证集和训练集分开是为了避免过度拟合。那我的问题是如果验证在神经网络中不进行任何权值更新，那么验证集如何帮助神经网络避免过度拟合？

浏览 2提问于2017-10-13得票数 4

回答已采纳

1回答

如何修正cv.zipath中的“变长差”错误？

、

试图使用来自cv.zipath包的mpath对零膨胀的泊松模型进行交叉验证。missings, family = "poisson", 交叉验证，data = list(：变量长度不同(“(权重)”) 我已经清理了所有NA的样本，但仍然遇到了错误消息。

浏览 0提问于2019-06-28得票数 1

回答已采纳

1回答

如何正确地合并集合中模型的输出？

、、

我正在努力弄清楚如何正确地创建回归组合。我知道有各种各样的选择。我使用以下方法。首先定义线性回归、GBM等模型，然后对每个模型运行GridSearchCV来了解最佳参数。问题是如何正确地将单个预测合并成一个Y向量？结果表明，将权系数分配给各预测值并不适合于回归问题。如果是，那么如何获得这样的权重系数呢？也许好的方法是用个人预测作为训练集来训练一个元模型？

浏览 4提问于2015-12-10得票数 6

回答已采纳

2回答

scikit了解用于交叉验证的不平衡数据的欠采样

、、

如何在scikit-learn中生成用于交叉验证的随机折叠？假设我们有一个类的20个样本，另一个类的80个样本，我们需要生成N个训练集和测试集，每个训练集的大小为30，在每个训练集中，我们有50%的类1和50%的类2。我找到了这个讨论()，但我不明白如何获得折叠。

浏览 3提问于2013-12-21得票数 6

1回答

如何在RandomizedSearchCV中使用样本加权？

、、、

我正在使用python中的scikit learn库，我希望在使用RandomizedSearchCV进行交叉验证期间对每个样本进行加权。sample_weight})AttributeError: 'list' object has no attribute 'copy' 值得一提的是，sample_weight是包含每个类的权重的浮点数的列表

浏览 1提问于2014-07-08得票数 2

1回答

sklearn加权分类树的数学公式

、、、

在生成简单的分类树时，我希望每个样本都有不同的权重。我知道您可以在拟合树时指定样本权重的向量。然而，我想知道杂质函数与权重的数学关系是什么。在数学公式文档中，我看不到权重在各种杂质度量中的位置：

浏览 2提问于2014-08-09得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

scikit中的样本权重-在交叉验证中学习失败

如何在GaussianNB和KNeighborsRegressor中使用类权重？

XGBRegressor与权重和base_margin:样本外验证可能吗？

LibSVM:交叉验证和测试时的-wi选项(权重选择)

在多层感知器中进行交叉验证时，我要初始化哪些模型？

如何交叉验证高度不平衡的数据集的深度学习模型？

在Matlab中使用lasso的左一出回归

R H20 -分层抽样和非I.D.交叉验证。行

Weka中的交叉验证

在scikit中class_weight参数是做什么的-学习SGD

您在sklearn方法cross_val_score中传递的cv参数是什么？

以假阴性为代价对机器学习预测进行加权

如何让ANN产生完全不同的结果？

验证集是否用于更新神经网络？

如何修正cv.zipath中的“变长差”错误？

如何正确地合并集合中模型的输出？

scikit了解用于交叉验证的不平衡数据的欠采样

如何在RandomizedSearchCV中使用样本加权？

sklearn加权分类树的数学公式

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐