腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
在
选择最佳
超
参数
组合
后
,SparkML CrossValidator是否重新适合完整的训练
数据
集
?
、
、
、
、
在
训练
数据
集
上
交叉
验证
超
参数
网格
后
,SparkML的CrossValidator是否重新适合
整个
训练
数据
集
?如果不是,它会从
交叉
验证
的哪一部分中选择用于推断的bestModel?为此,CrossValidator是否
使用
最佳
超
参数
在
整个
训练/
交叉
<
浏览 22
提问于2021-03-23
得票数 0
1
回答
基于
交叉
验证
的模型选择和
超
参数
整定工作流程
、
、
我一直试图教自己机器学习,并希望确保我
对
模型选择、
超
参数
优化和
交叉
验证
有正确的想法。
对</em
浏览 0
提问于2020-05-11
得票数 -1
2
回答
交叉
验证
问题
、
、
我遇到了许多
使用
交叉
验证
的方法,
对
所附问题的回答是迄今为止
对
我最好的解释。我的两难处境是,现在我无法弄清楚如何
使用
Kfold
验证
:-超音波调谐?也是怎么回事?我不知道
在
交叉
val之后该如何处理平均分数,如何处理这些褶皱,以及如何处理
对
k-1倍的列车
数据
进行训练的模型?
浏览 0
提问于2019-10-21
得票数 1
回答已采纳
2
回答
培训
集
交叉
验证
后
是否需要测试
集
?
、
、
、
、
我想引用Aurelien的“与Scikit学习和TensorFlow一起进行机器学习的手”一书中的一段,关于
在
使用
k-折叠
交叉
验证
对
训练
集
进行
超
参数
调整
之后
对
最终测试
集
的评估: “如果您进行了大量的
超
参数
优化(因为您的系统最终
对
验证
数据
进行了很好的
调整
,并且
在
未知
数据
浏览 0
提问于2020-08-14
得票数 1
回答已采纳
1
回答
超
参数
的优化与
交叉
验证
评估
、
、
我很难掌握如何
使用
交叉
验证
进行
超
参数
优化和评估的标准方法。我试着做10倍的简历。下列哪一种方法是正确的? 所有
数据
都用于
参数
调整
(例如,
使用
带有
交叉
验证
的随机网格搜索)。这将返回最佳的
超
参数
。然后,利用这些
超
参数
构造了一个新的模型,它可以通过
交叉
验证
(9倍的训练,1倍的测试)来评估,最后,我发
浏览 1
提问于2020-04-21
得票数 0
回答已采纳
1
回答
Scikit-learn
:
在
超
参数
调整
后
对
整个
数据
集
使用
交叉
验证
、
我正在
使用
scikit-learn
中的决策树
对
垃圾邮件进行分类。
在
阅读了这里和其他地方的各种帖子
后
,我将初始
数据
集
分为训练和测试,并
使用
交叉
验证
对
训练
集
进行了
超
参数
调整
。
在
我的理解中,应该计算训练和测试的分数,以检查模型是否过拟合;考虑到测试
集
上的分数是好的,我可以排除这一点,并呈现从
浏览 10
提问于2019-03-04
得票数 0
1
回答
交叉
验证
法
在
模型选择中的一些困惑
、
使用
Xtrain,我执行k折叠
交叉
验证
,
在
每个折叠内部
使用
来自Xtrain的索引
验证
模型。这个循环用于调优模型的
超
参数
。我从不
使用
Xtest来选择
超
参数
。我的理解正确吗?1)链接中的答案是: 您可以
使用
整个
集合上的
交叉
验证
来构建最终的模型,选择
超
参数
,然后
使用
优化的
超
浏览 0
提问于2018-07-18
得票数 0
回答已采纳
1
回答
LassoCV如何在scikit中学习分区
数据
?
、
、
、
我是执行线性回归
使用
拉索方法
在
雪橇。 根据他们的指导,以及我在其他地方看到的,不只是
对
所有的培训
数据
进行
交叉
验证
,而是建议将其划分为更传统的培训
集
/
验证
集
分区。因此,拉索
在
训练
集
上进行训练,然后根据
验证
集
交叉
验证
的结果
对
超
参数
α进行
调整
。最后,<e
浏览 3
提问于2014-06-15
得票数 8
回答已采纳
2
回答
拉索回归怀疑
、
、
、
对于这个问题,我
使用
了线性回归,但是有一个建议的解决方案是用Lasso回归。然而,用户已经
使用
了列车功能。我不明白为什么要
使用
火车功能。是拉索的语法吗?岭回归也采用了类似的函数。
浏览 0
提问于2018-06-24
得票数 1
1
回答
插入符号
交叉
验证
中的预处理
、
对于需要澄清的
数据
预处理,我有一个问题。据我所知,当我们通过
交叉
验证
来调优
超
参数
和评估模型性能时,而不是
对
整个
数据
集
进行预处理时,我们需要在
交叉
验证
中这样做。换句话说,
在
交叉
验证
中,我们
对
训练褶皱进行预处理,然后
使用
相同的预处理
参数
对
测试褶皱进行处理和预测。 在下面的示例代码
浏览 0
提问于2018-05-11
得票数 5
1
回答
参数
选择和k-折叠
交叉
验证
、
、
、
我有一个
数据
集
,需要对
整个
数据
集
进行
交叉
验证
,例如,10倍的
交叉
验证
。我想用径向基函数( RBF )核进行
参数
选择(RBF核有两个
参数
:C和γ)。通常,人们
使用
开发
集
来选择支持向量机的
超
参数
,然后
在
开发
集
的基础上
使用
最优的
超
参数
,并将其应用
浏览 2
提问于2016-05-06
得票数 2
1
回答
在
训练或
验证
分区上执行
交叉
验证
以优化
参数
。
、
、
、
我有一个大的
数据
集
,它被划分为三个块(训练-
验证
-测试)。我想要执行
交叉
验证
( CV ),因为我有一个大的
数据
集
,它将花费太长的时间来执行
整个
数据
集
的简历。什么是正确的分区来执行简历?我看过一些教程,它们只
使用
训练分割,而其他只
使用
验证
分割,而其他则
使用
整个
数据
集
。 感谢您的任何澄清或帮助。
浏览 0
提问于2018-09-25
得票数 1
回答已采纳
1
回答
何时
使用
交叉
验证
?
、
、
Cross-validation 嗨,我正在
使用
Weka
在
我的MSc论文中部署机器学习模型。我已经注意到,当我
在
训练
数据
集中
使用
10倍
交叉
验证
时,与
在
整个
数据
集
上没有
交叉
验证
的情况下训练模型相比,我得到了较低的评估指标,如果我
在
测试
数据
集
上测试该模型时获得更好的性能,这将是有意义的,然而,它保持相同的性能例如,
浏览 0
提问于2021-01-23
得票数 0
1
回答
我应该先执行train_test_split,然后执行GridSearchCV,然后执行K折叠
交叉
验证
吗?
、
、
我
在
GridSearchCV和K折叠
交叉
验证
之间有很多混淆。我知道GridSearch只用于
超
参数
优化,K折叠将我的
数据
分割成K折叠并在它们上迭代(cv值)。那么,我应该先将
数据
分割成训练
集
和
验证
集
,然后将GridSearch应用于训练
数据
以获得“最佳
参数
”,然后
使用
从GridSearch获得的“最佳
参数
”
对
训练
数据</
浏览 6
提问于2021-06-27
得票数 0
回答已采纳
1
回答
您是否预测过
交叉
验证
(gridsearchcv / KFold)
后
的测试
数据
,以及如何预测?
、
、
、
、
我的
数据
集
包含40个测量对象(MO)中每个对象的112个特征向量。共有4480个特征向量,平均分为4个类别,533个特征。(这里有更多关于的信息)
在
分割
数据
集
(训练:34 MO,测试:6 MO)和减少特征数目之后,主要通过主成分分析( PCA ),我用KFold
对
不同模型的
超
参数
进行了
调整
。问题:
在
评估时,是否有必要对列车和测试
数据
进行分割?我的教授说不行,
交叉
<e
浏览 3
提问于2020-12-18
得票数 0
回答已采纳
1
回答
如何
对
大型
数据
集
进行
交叉
验证
和
超
参数
调整
?
、
、
、
我有一个csv文件的10+gb,我
使用
了pandas.read_csv()中可用的"chunksize“
参数
来读取和预处理
数据
,用于训练模型想要
使用
的在线学习方法之一。通常
交叉
验证
和
超
参数
整定是
对
整个
训练
数据
集
进行的,并
使用
最好的
超
参数
来训练模型,但是
在
海量
数据
的情况下,如果我<em
浏览 9
提问于2017-09-26
得票数 1
回答已采纳
2
回答
在
交叉
验证
后
对
所有训练
数据
进行
scikit-learn
训练
、
我正在
使用
scikit-learn
来训练分类器。我还希望进行
交叉
验证
,但在
交叉
验证
之后,我希望
对
整个
数据
集
进行训练。编辑:我想用我所有的
数据
来训练具有最佳
交叉
验证
分数的分类器。
浏览 1
提问于2014-03-24
得票数 2
1
回答
超
参数
整定与
交叉
验证
、
、
、
我
对
交叉
验证
的正确
使用
有一些困惑。评估评估器的性能和可概括性。据我所知,这将是你将遵循的过程:
使用
交叉
验证
在
训练
集
(GridSearchCV)上建立模型并调优
超
参数
。
使用
测试<e
浏览 0
提问于2019-10-11
得票数 3
5
回答
交叉
验证
和网格搜索有什么区别?
、
、
、
简单地说,
交叉
验证
和网格搜索的区别是什么?网格搜索是如何工作的?我是不是应该先做
交叉
验证
,然后再做网格搜索?
浏览 17
提问于2013-10-12
得票数 53
1
回答
最终模型拟合-子集与
整个
训练
数据
、
、
如果我将
整个
可用培训
数据
的子集用于模型优化和超级
参数
选择,那么是否应该将最终模型与子集培训
数据
集
或
整个
可用的培训
数据
相匹配?例如,如果我有1万个可用的样本,并且我将一个100 K的随机样本作为测试保留,而200 K的随机样本作为模型调优的训练
数据
集
,那么用于
在
1) 200 K训练
数据
集
上拟合最终模型的调优超级
参数
,还是2)900 K可用
数据
(不包
浏览 0
提问于2020-06-24
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
10,模型的优化
嫌手动调参太麻烦?——这里有一份自动调参的“秘籍”送给你
不会Scikit-Learn的这些功能,你能玩转机器学习?
Scikit-learn玩得很熟了?这些功能你都知道吗?
Keras文本分类实战(下)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
即时通信 IM
活动推荐
运营活动
广告
关闭
领券