腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
同时
进行
特征
选择
和
超
参数
调整
、
、
、
、
我正在尝试在sklearn SVC模型上
进行
超
参数
调整
和
特征
选择
。使用独立于HalvingGridSearchCV的cross_val_score运行管道代码是可行的,但我希望
同时
进行
特性
选择
和
超
参数
调优,以找出哪种特
浏览 20
提问于2021-06-13
得票数 0
回答已采纳
1
回答
用于
特征
选择
的LightGBM
、
、
我正在研究一个二进制分类问题,我的训练数据有数百万条记录
和
2000个变量。我运行lightGBM
进行
特征
选择
,并使用从lightGBM中
选择
的特性运行神经网络(使用Keras)模型
进行
预测。当使用lightGBM
进行
特性
选择
时,我正在
进行
超
参数
调优。这是基于我的理解,随着
超
参数
的变化,所
选择
的功能也会有所不同。我使用'goss‘算法<e
浏览 7
提问于2020-07-07
得票数 2
1
回答
模型整定与模型拟合的
特征
顺序
、
、
假设同一列(即
特征
)用于
超
参数
调整
和
模型拟合,而集成模型用于建模(例如,随机森林或XGboost),那么在
超
参数
调整
过程中使用的列的顺序是否应与基于最佳
超
参数
拟合模型时使用的列的顺序相同?我在我的简历管道中使用sklearn的make_column_transformer函数
进行
超
参数
调整
。不幸的是,当将余数
参数
设置为“pass
浏览 0
提问于2020-02-10
得票数 1
回答已采纳
1
回答
如何找到基尼系数变化的意义?
、
、
进行
一些更改(
特征
选择
、
超
参数
调整
等)我用不同的基尼系数建立了不同的模型。 怎样才能证明基尼系数的改善在统计学上是显著的呢?
浏览 0
提问于2022-10-06
得票数 0
1
回答
如何在中使用RFE?
、
、
、
、
,它返回一个助推器,但我想使用RFE来
选择
最佳的100个特性。返回的助推器不能在RFE中使用,因为它不是sklearn估计器。有没有什么方法可以把xgb.train(...)
和
sklearn的RFE一起使用呢?
浏览 2
提问于2021-02-22
得票数 7
1
回答
什么时候使用最好的
超
参数
-
特征
选择
或建模?
、
、
、
、
我正在使用不同的算法对977行
进行
二进制分类。正如您可能知道的,包装方法涉及使用ML模型来找到最佳的特性子集。因此,我的问题如下( c)期望( a)
和
( b)的最佳<em
浏览 0
提问于2022-02-22
得票数 0
回答已采纳
1
回答
如果我的模型适合TensorFlow,这是件好事吗?
、
、
、
我用的是正规化、大量辍学
和
早期停工。从总体上说,抛弃一些
特征
可以吗?
浏览 0
提问于2017-08-21
得票数 1
1
回答
整个模型开发过程的优化
、
、
、
我有几个开发阶段,每个阶段都可以自动执行:预处理,去除异常/异常,过采样,
特征
选择
,
超
参数
调整
。这些步骤中的每一个都有许多不同的实现。例如,您可以调优
超
参数
,删除10%未使用的函数,重复对
超
参数
的搜索。训练几个模型,并将它们组合成一个整体。用1种算法去除异常,然后再用另一种算法。在
特征
选择
之后或之前删除异常。我还想对不同的输入数据集执行所有这些步骤(所有这些步骤都在
选择
最
浏览 0
提问于2022-12-11
得票数 0
1
回答
在时间序列数据分类中,是否需要对同一模型
进行
不同的
调整
,以适应不同的窗口大小?
、
、
众所周知,在时间序列中,我们通过被称为窗口的模型对时间序列数据
进行
一次一次的处理。我们滑动窗口,下一个窗口又是我们的输入。由于我刚刚开始从事深度学习
和
时间序列领域的工作,我的问题是,如果我们对某个深度学习模型
进行
某些窗口大小的调优,那么如果使用相同的调优模型来获得相同数据上的一些不同窗口(例如15)的精度,或者模型应该再次对后一个窗口
进行
调优由此,我再次相信窗口大小是一个
超
参数
,当更改该
参数
时,需要再次对模型
进行
调整
。 那么,在这种情
浏览 0
提问于2019-07-23
得票数 0
回答已采纳
2
回答
如何让python在运行.py文件时跳过某些代码块?
我正在做
超
参数
调整
,
特征
选择
,训练
和
拟合几个模型,以评估哪个是最好的模型。所以可能有几百行代码。然而,正如我们可能知道的那样,
超
参数
调整
部分通常需要几个小时来生成用于我们模型的最佳
参数
的输出。因此,简而言之,这个人不需要运行需要几个小时的
调整
部分
和
其他需要超过3分钟的部分来生成输出,但他仍然能够预测我的模型并使用我之前
调整
过的最佳
超
参数<
浏览 2
提问于2021-10-01
得票数 1
1
回答
分类
参数
传递整数值的Cloud ML
超
参数
调优
最近,当我提交分类
参数
的
超
参数
调整
的训练作业时,Cloud ML传递了带有整数值的选项,而不是文档中描述的categoricalValues
参数
中的
选择
。是云ML
超
参数
调整
的回归,还是功能的变化?我不能保证文档与当前行为不匹配(我认为它是模棱两可的)。无论如何,行为显然已经改变了,如果是永久性的
特征
改变,我必须处理它。 谢谢,
浏览 12
提问于2017-01-26
得票数 0
回答已采纳
2
回答
在使用train_test_split时使用GridSearchCV
和
交叉验证是否有意义?
、
我使用交叉验证的GridSearchCV来训练
和
调优不同模型类型(例如回归树、岭、弹性网等)的模型
超
参数
。在对模型
进行
拟合之前,我省略了10%的样本,以便使用train_test_split
进行
模型验证。(见截图)。我
选择
具有最佳
参数
的模型来对未见验证集
进行
预测。我是不是遗漏了什么,因为我还没有看到有人在评估模型的准确性,
同时
调整
模型
参数
时也没有看到有人这样做吗? 📷
浏览 0
提问于2020-02-08
得票数 2
回答已采纳
2
回答
超
参数
优化组合与模型
选择
、
、
这是对深度学习算法
和
机器学习算法(如递归神经网络、多层感知器或支持向量机)
进行
调整
时经常出现的一个普遍问题。我的问题正是这样:有无限多的
超
参数
组合可能。我们知道,有许多可能的
超
参数
配置可能
浏览 0
提问于2018-06-10
得票数 2
2
回答
基础:为ML准备简单数据的正确顺序是什么?
、
、
我只是想知道用以下步骤组织数据以避免冗余的最佳方法是什么:数据缺口的核算(估算)将数据拆分为培训
和
验证集 然后对模型
进行
拟合
和
预测。我的主要问题是,在对数据
进行
编码之前,是否最好先
进行
拆分,还是只在完成编码后才
进行
拆分?
浏览 0
提问于2018-08-09
得票数 0
1
回答
支持向量机-anova的网格搜索
超
参数
并在Sklearn中得到所
选择
的
特征
、
、
、
、
y,7,shuffle=True, random_state=5), scoring='roc_auc', n_jobs=1)它工作得很好,通过这样做,我可以
同时
调整
Anova
和
SVM的
参数
,并使用这些
参数
来建立我的最终模型。如果是这样的话,如果我想进一步了解所选的
特征
,我如何确定Anova
选择
的特性?比如说,我用一对
参数
( Anova的百分位数
和
支持向量机的C/
浏览 4
提问于2015-04-19
得票数 1
回答已采纳
1
回答
CatBoost:我们是不是过火了?
、
、
、
、
按时间顺序对数据
进行
排序,并将其划分为训练、有效
和
测试集。 然而,我担心我们可能会过分适应第4步中的测试集。在步骤4中,我们是否应该在没有调优的情况下在列车上重新
浏览 5
提问于2021-10-20
得票数 2
1
回答
如何在使用BayesSearchCV时提取最佳
特征
?
、
、
、
当使用Skopt的BayesSearchCV
进行
功能
选择
时,如何提取最佳功能集的功能名称?我只知道如何获得
特征
的数量以及其他
超
参数
,但无法找到如何获得这些最佳
特征
的名称。
浏览 52
提问于2021-09-15
得票数 0
3
回答
为什么不在火车数据集上优化
超
参数
呢?
、
、
在开发神经网络时,通常会将训练数据划分为列车、测试
和
保留数据集(许多人将这些数据分别称为列车、验证
和
测试)。同样的东西,不同的名字)。许多人建议根据测试数据集中的性能
选择
超
参数
。我的问题是:为什么?在本文中,数据集现在被称为Train、Validation
和
Test。我不使用测试数据集
进行
培训。我正在使用GA来优化
超
参数
。在外部遗传算法训练过程的每次迭代中,遗传算法
选择
一个新的
超
参数</em
浏览 1
提问于2016-07-05
得票数 5
回答已采纳
1
回答
多少个时代就足够了?
在训练输入的数量、
特征
的数量
和
足够学习模型的时代数之间有公式吗?
浏览 0
提问于2019-07-10
得票数 0
1
回答
您是否预测过交叉验证(gridsearchcv / KFold)后的测试数据,以及如何预测?
、
、
、
、
我的数据集包含40个测量对象(MO)中每个对象的112个
特征
向量。共有4480个
特征
向量,平均分为4个类别,533个
特征
。(这里有更多关于的信息)在分割数据集(训练:34 MO,测试:6 MO)
和
减少
特征
数目之后,主要通过主成分分析( PCA ),我用KFold对不同模型的
超
参数
进行
了
调整
。问题: 在评估时,是否有必要对列车
和
测试数据
进行
分割?我的教授说不行,交叉验证本身就已经过时了。
浏览 3
提问于2020-12-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
交叉验证和超参数调整:如何优化你的机器学习模型
python二分类模型精度低怎么办
AI算法的调优流程
机器学习工程师心得:特征工程比超参数调优更重要
数据分享|R语言决策树和随机森林分类电信公司用户流失churn数据和参数调优、ROC曲线可视化
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券