特征工程技能图谱

关键字全网搜索最新排名

【机器学习算法】:排名第一

【机器学习】:排名第二

【Python】:排名第三

【算法】:排名第四

特征工程所涵盖的问题

本文主要想强调特征工程中涵盖了哪些问题以及通过哪些方式解决这些问题,并未给出具体的解决算法,只是想帮助大家对于特征工程从全局上有一个了解。在进行特征工程时,并不是将下列的所有处理都进行一遍,而是根据自己所使用数据的具体情况分析。

点击查看大图

1 数据预处理   1.1 无量纲化     1.1.1 标准化     1.1.2 区间缩放法     1.1.3 标准化与归一化的区别   1.2 对定量特征二值化   1.3 对定性特征哑编码   1.4 缺失值计算   1.5 数据变换 2 特征选择   2.1 Filter     2.1.1 方差选择法     2.1.2 相关系数法     2.1.3 卡方检验     2.1.4 互信息法   2.2 Wrapper     2.2.1 递归特征消除法   2.3 Embedded     2.3.1 基于惩罚项的特征选择法     2.3.2 基于树模型的特征选择法 3 降维   3.1 主成分分析法   3.2 线性判别分析法

参考资料:

  1. 知乎-特征工程到底是什么?(链接:https://www.zhihu.com/question/29316149)
  2. 百度词条(特征工程)

原文发布于微信公众号 - 机器学习算法与Python学习(guodongwei1991)

原文发表时间:2017-06-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏about云

机器学习工程师|数据科学家面试流程介绍(含面试题)

问题导读 1.机器学习工程师面试的流程是什么? 2.本文典型的第一轮面试由哪三部分组成? 3.对于基本的常识问题你是否有更好的理解及答案?

14440
来自专栏人人都是极客

MobileNetV2:下一代边缘计算视觉网络

随着在移动设备上运行深度网络可以提升用户体验,而且允许随时随地可以访问,并且在安全性、隐私和能耗方面相对云端计算具有优势,边缘计算的需求越来越大。

13810
来自专栏媒矿工厂

HDR关键技术:质量评价技术(续)

在上一篇HDR质量评价帖中,我们列举了业内常见的HDR质量评估算法,然而不同算法有不同的应用领域。本文将结合重要的HDR技术,进一步描述HDR质量评价技术。本文...

82330
来自专栏数据科学与人工智能

【原理】机器学习偏差与方差

小编邀请您,先思考: 1 为什么KNN算法在增大k时,偏差会变大? 2 RF增大树的数目时偏差却保持不变,GBDT在增大树的数目时偏差却又能变小? 在机器学习的...

383110
来自专栏大数据文摘

学界 | NLP年度盛宴EMNLP/CoNLL 2018最精彩论文精选(摘要+评论)

每年,全球最顶尖的NLP研究者们会在这两个大会上展示最前沿的NLP科研成果。然而,动辄上千篇的论文却令很多关注NLP领域最新动态的小伙伴望而却步。

15520
来自专栏人工智能LeadAI

机器学习面试之偏差方差

在机器学习的面试中,能不能讲清楚偏差方差,经常被用来考察面试者的理论基础。偏差方差看似很简单,但真要彻底地说明白,却有一定难度。比如,为什么KNN算法在增大k时...

38940
来自专栏AI研习社

CVPR 2018摘要:第四部分

我们已经分三期关于CVPR 2018(计算机视觉和模式识别)会议:第一部分专门讨论计算机视觉的GAN,第二部分涉及关于识别人类(姿势估计和跟踪)的论文,第三部分...

8220
来自专栏机器之心

学界 | 机器理解中的迁移学习,斯坦福联合微软提出SynNet网络

选自arXiv 机器之心编译 参与:李亚洲、Smith 近日,斯坦福大学、微软联合发表了一篇论文,提出了一种在机器理解(MC)中使用 2-阶段合成网络(SynN...

416150
来自专栏AI科技大本营的专栏

经典重译 | 来自华盛顿大学教授的机器学习“内功心法”

本文最初发表在 《ACM通讯》2012年第10辑。作者是华盛顿大学教授,著名的机器学习专家 Pedro Domingos。作者2016年凭借畅销书《终极算法》而...

35470
来自专栏量子位

你的广告能打几分?Kaggle需求预测挑战赛冠军方案这样做丨教程

我们每天在网页上看到的各种电商广告,到底够不够吸引人?4个月前Kaggle和“俄罗斯版58同城”Avito办了个需求预测挑战赛,预测不同的广告能吸引用户多大的购...

12940

扫码关注云+社区

领取腾讯云代金券