泡在机器学习研(ju)究(keng)里的你,可能遇到过以下问题:
今天,谷歌开发者推特账号终于上线了《机器学习规则(Rules of Mahchine Learning)》的中文版(撒花.gif)。
这本“葵花宝典”可是汇聚了谷歌大脑高级科学家Martin Zinkevich开发Yoututbe、Google Play、Google Plus等谷歌重磅级产品后的血泪,总共包含43条规则,全文干货满满。
总的来讲,这篇总结的结构大概是这样:
第一部分帮助大家了解,构建机器学习系统之前要明确可实现的目标如何设计;
第二部分介绍了机器学习工程的第一个的阶段:如何部署第一个管道。保证易用的同时,还要单独进行测试,选择一个可观察可归因的简单指标;
第三部分谈到了新特征的添加发布、迭代、如何评估模型,以及如何应对训练-应用偏差;
最后一部分介绍了当大家达到稳定阶段时该怎么做。
文章特别特别强调了做机器学习的工程项目的一个核心理念:
要打造优质的产品,就请把自己看成是一位出色的工程师,而不是一位机器学习专家。
以后再遇到什么问题,回来翻翻这本机器学习工程实践就好。相信你到时会有打通六脉的感觉。
附上《机器学习规则(Rules of Mahchine Learning)》中文版原文:
https://developers.google.com/machine-learning/rules-of-ml/#before_machine_learning
p.s.友情提示:全文一万六千多字,建议先收藏,找个月黑风高没人打扰的夜晚,到PC端上慢慢研读:)