首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习实战 -- 机器学习解决问题的通用流程

机器学习实战 -- 机器学习解决问题的通用流程

作者头像
MachineLP
发布2019-05-26 15:32:02
3850
发布2019-05-26 15:32:02
举报
文章被收录于专栏:小鹏的专栏小鹏的专栏

机器学习解决问题的通用流程:

通用流程主要分为四部分:问题建模、特征工程、模型选择、模型融合。​​​​​​​​​​​​​​

一、问题建模

  • 收集问题资料,深入理解问题,然后将问题抽象成机器可预测的问题。
  • 明确业务目标和模型预测目标。
  • 根据预测目标选择适当的评估指标用于模型评估。
  • 从原始数据中选择最相关的样本子集用于模型训练,并对样本子集划分训练集和测试集,应用交叉验证的方法对模型进行选择和评估。

完成问题建模、对数据进行筛选和清洗之后,进行数据抽取特征,即特征工程。

二、特征工程

  • 特征工程是一项很重要但又困难的任务,不仅需要我们对模型和算法有深入的理解,还需要有很扎实的专业领域知识。
  • 工业界大多数成功应用机器学习的问题,都是在特征工程方面做得很好。
  • 虽然不同模型和不同问题都会导致特征工程差异很大,但仍有很多特征工程的技巧可以通用。

进行特征工程是为了将特征输入给模型,让模型数据中学习规律。

三、模型选择

  • 众多模型中选择最佳的模型需要对模型有很深入的理解。

四、模型融合

  • 充分利用不同模型 的差异,进一步优化目标。

参考:

《美团机器学习实战》

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018年11月18日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档