前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

算法岗位做数据挖掘大多都是抽特征跑跑现成模型”

作者头像
学到老
发布2018-03-16 13:09:17
7170
发布2018-03-16 13:09:17
举报

这句话,说起来很简单,看起来也很容易,但真的是这样吗? 我列举几点,扩展一下上面这句话: 1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征? 2、特征合理吗?预处理流程正确吗?有效吗?特征会泄露标签信息吗?特征时间维度一致吗? 3、用什么模型?模型出来的结果有什么业务含义?该怎么定义合适的指标来判断模型的性能? 4、根据模型结果,怎么回调特征,参数? 还有很多。造轮子,在工业界的数据挖据流程当中真的不重要。 假设你很牛逼,造了个GBDT,但是你比xgboost在同一数据集下好上多少?一个点?两个点?快上几秒?在牛比的特征工程面前都没有太大意义。

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档