首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在特征选择之前或之后采样

在特征选择之前或之后采样
EN

Stack Overflow用户
提问于 2020-08-12 19:46:30
回答 1查看 1.3K关注 0票数 1

我对特征选择、采样和交叉验证的顺序感到困惑,我的数据集有468行和23000列,其中269个属于I类,199个属于II类,当拆分训练和测试时,训练.Due中的数据有215个I类和159个II类,以减少样本数量我不得不对训练数据应用SMOTE过采样以减少偏差。或者我应该在这里应用采样,这会导致数据丢失,从而导致更小的样本。I)先应用过采样,然后应用特征选择技术,然后进行交叉验证:在交叉验证过程中,可能会由于过采样导致重复行而导致偏差。II)首先应用特征选择技术,然后进行过采样,然后进行交叉验证,这将导致与上述相同的偏差。III)首先应用特征选择技术,然后在10折交叉验证中对9折数据进行采样。IV)从交叉验证开始,在每次迭代中执行特征选择,然后对所选特征数据执行过采样。V)从交叉验证开始,在每次迭代中对9倍数据进行采样,并对9倍采样数据进行特征选择

哪些技术是正确的方法,也提供了良好的结果。

EN

回答 1

Stack Overflow用户

发布于 2020-12-17 18:57:55

SMOTE论文描述了在采样之前应该执行特征选择。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/63375860

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档