什么是特征工程?
维基百科定义:Feature engineering is the process of using domain knowledge of the data to create features that make machine learning algorithms work.
特征工程是利使用数据的领域知识来创建使机器学习算法工作的特征的工程。
引自知乎:“数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。” -特征工程目的是最大限度地从原始数据中提取特征以供算法和模型使用。
下面一张分类图显示特征工程的主要内容和方法:
特征工程强调问题的构造和特征(变量)的选择,类似数据分析中数据的清洗和转换,针对具体问题,要多上手实践。