首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >特征选择怎么选? | 讨论

特征选择怎么选? | 讨论

作者头像
数说君
发布2018-04-04 16:57:41
7900
发布2018-04-04 16:57:41
举报
文章被收录于专栏:数说工作室数说工作室

想构建一个模型,几十万行数据、400多变量,怎么选?

(1)全部塞进去

模型运行慢,一不小心跑一个月能受得了?更关键塞进了那么多无效变量,效果肯定也不好啊。

(2)按照业务理解选择

不是所有场景都那么好选的,而且这样永远无法发现新的异动点。

(3)PCA主成分压缩

首先PCA这个过程就很慢不说,无效变量还是没有被计算进来了。

......

那么在实际项目中,你是如何进行特征选择的?哪些方法如何实现呢?

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-12-01,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 数说工作室 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档