腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将
GridSearchCV
中
的
验证
集
与
训练
集
分开
规范化
?
、
、
、
如何在
GridSearchCV
中分别缩放每个折叠? 在
训练
ML模型时,我们应该对
训练
数据
的
特征进行归一化(缩放)。然后在测试数据上使用拟合
的
定标器。但是如果使用网格搜索CV (5折),我们通常会向它提供已经缩放
的
训练
数据。然后被分成多个折叠。但是我们如何分别扩展4-1个折叠层呢?X_test) # not train and validation separately cv
浏览 43
提问于2019-10-11
得票数 2
1
回答
GridsearchCV
的
预处理
、
、
、
、
我使用
GridsearchCV
来调优超参数,现在我想在
训练
和
验证
step.But时做一个min Normalization(StandardScaler()),我想我不能这样做。问题是: 如果我将预处理步骤应用于整个
训练
集
,并将其发送到
GridsearchCV
进行10 foldCV。这会让我发现数据泄漏对吧?因为
训练
集
将运行10倍,这意味着9倍
的
训练
和1倍
的
测试折叠。
规范化
应该
浏览 2
提问于2019-04-15
得票数 4
回答已采纳
2
回答
学习和预测误差分析(Scikit
GridSearchCV
)
、
、
我想手动分析我
的
ML模型(无论哪个)所做
的
错误,将其预测
与
标签进行比较。根据我
的
理解,这应该在
验证
集
的
实例上完成,而不是在
训练
集
上。我通过
GridSearchCV
训练
我
的
模型,提取best_estimator_,在交叉
验证
期间表现最好
的
那个,然后在整个数据
集
上重新
训练
。因此,我
的
问题是:如果我
浏览 32
提问于2020-09-25
得票数 0
回答已采纳
2
回答
validation_curve如何计算test_scores
、
、
我正在浏览validation_curve
的
sci学习文档,并看到它返回了两组不同
的
数据: train_scores:
训练
集
上
的
形状数组(n_ticks,n_cv_folds)分数。test_scores:形状数组(n_ticks,n_cv_folds)在测试
集
上得分。在给定
的
函数
中
,我们只传递一个X和y数组,它如何从传递
的
训练
数据中计算test_scores,它是否执行固有的train_test_split
浏览 6
提问于2020-10-18
得票数 0
1
回答
grid.score(X_valid,y_valid)和grid.best_score_有什么区别?
、
、
、
在做
GridSearchCV
时,通过grid.score(.)获得
的
分数之间有什么区别?和grid.best_score_grid.fit(X_train, y_train) scores = grid.score(estimator=my_model,我想知道两者之间
的
区别,以及以下哪一种应该被认为是从给定
的</em
浏览 3
提问于2021-09-03
得票数 0
回答已采纳
2
回答
GridSearchCV
:如何指定测试
集
?
、
、
、
"f1")gs_clf = gs_clf.fit(corpus.data, corpus.target) 如果是这样的话,我将如何从那里得到我
的
训练
集
我看到了使用train_test_split将语料库分割成测试
集
和
浏览 1
提问于2016-11-11
得票数 7
回答已采纳
1
回答
在
GridSearchCV
中
对测试
集
进行预处理
的
问题
、
、
、
我使用20%
的
数据
集
作为我
的
测试
集
,并使用
GridSearchCV
来实现K折交叉
验证
来调优超参数。 通过使用管道,我们可以将列转换器和机器学习算法一起放入
GridSearchCV
中
。如果我为
GridSearchCV
设置了5折交叉
验证
,该函数将使用5个不同
的
训练
和
验证
集
来
训练
和
验证
每个超参数组合。据我所知,<em
浏览 10
提问于2021-11-17
得票数 0
1
回答
python:在
验证
集
上优化模型
的
参数
、
理论上说,将数据
集
分解为三组:
训练
集
用于
训练
模型,
验证
集
用于调整参数,测试
集
用于评估性能。我有10个班,对于火车数据,每个班有1017个样本。在
验证
和测试集中,我为每个类提供了300个样本。 我对我
的</e
浏览 5
提问于2017-05-13
得票数 1
回答已采纳
2
回答
用Keras规范神经网络
的
验证
集
、
、
、
、
所以,我知道
规范化
对于
训练
一个神经网络是很重要
的
。我
的
问题是:我如何在Keras
中
做到这一点?我现在要做
的
是:from keras.models import Sequentialfrom keras.callbacksnorm_in
浏览 2
提问于2017-07-25
得票数 3
回答已采纳
6
回答
使用显式(预定义)
验证
集
进行sklearn网格搜索
、
、
、
我有一个数据
集
,它以前被分成3组:
训练
、
验证
和测试。为了比较不同算法
的
性能,必须按照给定
的
方式使用这些集合。 现在,我想使用
验证
集
来优化支持向量机
的
参数。但是,我无法找到如何显式地将
验证
集
输入到sklearn.grid_search.
GridSearchCV
()
中
。下面是我以前在
训练
集
上做K交叉
验证
时使用
的
一些
浏览 15
提问于2015-08-11
得票数 53
回答已采纳
1
回答
在网格搜索
中
对所有组合使用交叉
验证
、
、
、
、
我已经将我
的
数据分成了一个
训练
集
和一个
验证
集
,我使用
GridSearchCV
训练
了不同
的
超参数,并找到了最好
的
。现在,我想在培训
集
和
验证
集
上打印所有这些
的
结果。
训练
集
非常容易,因为
GridSearchCV
有一个名为grid_scores_
的
属性(我正在使用scikit-LearchVersio
浏览 0
提问于2016-11-20
得票数 0
回答已采纳
1
回答
Scikit-学习-如何使用单个静态
验证
集
的
CV对象?
、
、
、
、
在Scikit
中
,学习RandomSearchCV和
GridSearchCV
需要cv参数
的
交叉
验证
对象,例如GroupKFold或其他来自sklearn.model_selection
的
简历分配器。但是,如何使用单一
的
静态
验证
集
?我有很大
的
训练
集
,很大
的
验证
集
,我只需要简历对象
的
接口,而不是整个交叉
验证
。具体来
浏览 3
提问于2021-05-30
得票数 0
回答已采纳
1
回答
规范时间序列
的
验证
集
是一种前瞻性偏差吗?
、
、
、
下面是一篇关于使用LSTM进行股票预测
的
文章
中
时间序列
的
数据归一化过程:
训练
数据,使用20%
的
样本作为
验证
集
。默认情况下,Keras
的
模型使用最后20
浏览 0
提问于2019-03-09
得票数 3
1
回答
关于网格搜索和KFold
的
问题
、
、
我正在尝试一个示例,我正在使用Cudf和CUml在一个巨大
的
数据
集
上
训练
500万行(只有4个特性),并且我使用SGD逻辑回归,因为我必须预测病人是否生病。我使用分层k折叠,因为数据
集
有大约20474受感染,其余
的
4_979_256是健康
的
。我将使用召回或f1评分作为衡量标准。 我已经做了5个分层k倍,现在我想做一个网格搜索。我在手册https://scikit-learn.org/stable/modules/generated/
浏览 0
提问于2023-02-27
得票数 0
2
回答
管道
的
变压器作用于
训练
数据,而不是
GridSearchCV
中
的
全部数据。
、
我使用管道和
GridSearchCV
自动选择功能。由于数据
集
很小,所以我将
GridSearchCV
中
的
参数'cv‘设置为StratifiedShuffleSplit。("select", selection), ("classify", clf)]) grid_search =
GridSearchCV
(pipeline, param_grid=para
浏览 6
提问于2016-12-10
得票数 0
回答已采纳
2
回答
滑雪
GridSearchCV
模型
的
拟合
、
、
、
、
我试图在上解决一个回归问题,借助,.I使用来选择最佳
的
超参数。我应该把
GridSearchCV
放在X_train, y_train上,然后得到最好
的
参数吗?(X,y=整个数据
集
)如果我把它放在X, y上,得到最好
的
参数,然后在这些最佳参数上建立一个新
的
模型。现在我该如何
训练
这个新模式呢?我应该在X_train, y_train或X, y.上
训练
新型号如果我在X,y上
训练
新
的
模型,我将如何
浏览 1
提问于2018-11-23
得票数 7
1
回答
我应该先执行train_test_split,然后执行
GridSearchCV
,然后执行K折叠交叉
验证
吗?
、
、
我在
GridSearchCV
和K折叠交叉
验证
之间有很多混淆。我知道GridSearch只用于超参数优化,K折叠将我
的
数据分割成K折叠并在它们上迭代(cv值)。那么,我应该先将数据分割成
训练
集
和
验证
集
,然后将GridSearch应用于
训练
数据以获得“最佳参数”,然后使用从GridSearch获得
的
“最佳参数”对
训练
数据使用K折叠,然后对整个数据(
训练
+
验证
集
)进行<
浏览 6
提问于2021-06-27
得票数 0
回答已采纳
1
回答
如何将
train+validation集合标准化?
、
这个问题在某种程度上
与
:在推断测试
集
之前加入培训和
验证
集
是正确
的
吗?有关分割数据使用mean+std from 2规范
验证
和测试数据现在我们有了一个我们满意
的
模型和超视距。上面的问题表明它是好
的
,然后一起
训练
一个使用train+validation数据
的
模型。但我很困惑
浏览 0
提问于2021-07-18
得票数 0
回答已采纳
1
回答
如何利用sklearn.cross_validation.cross_val_score获得拟合参数?
有什么方法可以获得性能最好
的
模型
的
参数吗?
浏览 2
提问于2015-09-14
得票数 0
回答已采纳
1
回答
在选择最佳超参数组合后,SparkML CrossValidator是否重新适合完整
的
训练
数据
集
?
、
、
、
、
在
训练
数据
集
上交叉
验证
超参数网格后,SparkML
的
CrossValidator是否重新适合整个
训练
数据
集
?如果不是,它会从交叉
验证
的
哪一部分中选择用于推断
的
bestModel?拟合
的
CrossValidator使.transform()方法可用。为此,CrossValidator是否使用最佳超参数在整个
训练
/交叉
验证
数据
集
上重新
训练
,
浏览 22
提问于2021-03-23
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
机器学习的算法测试与验证:训练集、测试集、验证集以及交叉验证
机器学习基础Python训练集测试集分割与交叉验证
《海洋预报》|基于梯度依赖OI的全球多参数Argo数据集的构建与验证
周智伟|用于复合材料结构健康监测算法训练与测试的数据集
——这里有一份自动调参的“秘籍”送给你
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券