首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >在特征工程中,选择不同类型的最佳k特征的正确方法是什么?

在特征工程中,选择不同类型的最佳k特征的正确方法是什么?
EN

Stack Overflow用户
提问于 2022-03-11 13:49:48
回答 1查看 42关注 0票数 0

我有81个特点,我想从其中选择最好的K,这将是最有用的预测标签。有些特性是数字的,有些是序号的,其余的是绝对的。例如,在这种情况下,我应该独立处理不同类型的功能组吗?

例如:选择所有的数值特征,然后建立一个相关矩阵,然后选择那些与标签相关性最好的特征(并且彼此之间的相关性最小)。接下来,获取分类特性,进行卡方检验,并选择最上面的k属性。然后是顺序变量的其他特征选择方法。

最后,我将从每一组中分别获得最优秀的特性。对于大型数据集来说,这是否是一种合适的方法?还是应该使用某种嵌入式方法,比如整个数据集上的随机森林来确定k个最重要的特性?

EN

回答 1

Stack Overflow用户

发布于 2022-03-11 14:03:57

我推荐下列方法之一:顺序特征选择器(SFS)、顺序后向选择器(SBS)、顺序前向浮点选择器(SFFS)、顺序后向浮点选择器(SBFS)。

您可以在这个链接中读到更多关于它的内容。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71439551

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档