收藏 | 来自微软大神的机器学习秘籍!

在这个人人都可能是学霸的全民学习时代,为什么人与人的差距依然很大?像优达学城这样的学习网站可以为每一个人想要学习的人带去技能和知识的补充,但要成为一个优秀的人才,你还需要一点点…嗯…特性!在这篇文章中,曾供职于微软的机器学习工程师从一个角度来谈谈成为优秀的机器学习工程师必备的9大特性。

关于这个话题,你可能已经读到过许多从技术角度给出建议的文章,比如你应该要有怎样的基础知识,上什么课,读哪些论文。本文将从另一个角度来解答这个问题,谈谈一个优秀的机器学习工程师应该要有(或者说应该努力去培养)怎样的特性。

01 你要能够享受迭代开发的乐趣。

如果你想开发一个机器学习系统,你要首先快速地用一个简单的模型开发一个最初版本,然后在此基础上不断迭代去改进它。

02 你要对于什么时候停止一个项目有很好的直觉。

对任何机器学习系统来说,只要继续迭代下去,你总能得到更好的准确率。但从某个时刻开始,你所获得的收益会超过你付出的精力。你要能找到这个点在哪里。

03 你要能坦然面对失败。

你的模型和实验中有很大一部分到最后都会失败。这是没关系的。

04 你应该是好奇心驱动的。

最优秀的那一批人,真正对世界充满好奇并用这份好奇心来驱动他们对机器学习的热情。

05 你要有很强的数据直觉。

要善于发现数据中的模式。为了做到这一点,能够迅速地用 R、Python、Matlab 或是 Excel 等工具制作可视化图表是很重要的。

06 你要对指标(Metrics)有很强的感觉,做一个指标驱动的工程师。

你要能够机建立合适的指标来衡量你的系统是否成功。你要很习惯做双盲试验,以及使用像是精确率(Precision)、召回率(Recall)、准确率(Accuracy)、ROC、转化率(Conversion Rates)、NDCG 等这样的名词。

07 但你要时刻记住,指标(Metrics)并不是万能的。

指标可以很好地从较高的层次描述你的系统表现如何。但与此同时,你也不应该放弃去直接观察个别例子。手工地查看你的系统表现最好和最坏的例子,以及随机抽样的例子,能够反映出许多指标所不能告诉你的问题。

08 你要能够确立一个解决模型漏洞和错误预测的通用途径。

零散地修复几个 bug 只能让你达到局部最优,而且这些补丁的引入往往还会使你的模型更复杂,更难上手。你应该把所有的问题放在一起考虑,找出几个通用的解决方案,从而确定在下一轮迭代时能够解决哪些影响最大的问题。

09 在建立模型时,你要能够从用户的角度出发来考虑。

要开发一个你自己觉得好的系统很容易,但要让你目前和未来的用户满意就很难了。以自我为中心做出决策也很容易带有偏向,你要牢记这一点并尽力避免。

来源:数知榜单

原文发布于微信公众号 - 大数据(hzdashuju)

原文发表时间:2018-03-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏老秦求学

[推荐系统读书笔记]好的推荐系统

在这个时代,无论是信息消费者还是信息生产者都遇到了很大的挑战:作为信息消费者,如何从大量信息中找到自己感兴趣的信息是一件非常困难的事情;作为信息生产者,如何让自...

1124
来自专栏点滴积累

人工智能入门

前言 这个名字起的非常大,但是本文只能从一些概念和我自己的理解上介绍一下什么是人工智能。本文只是给从未接触过此块的人一个大致的印象和思路,其余人请直接略过。 一...

4667
来自专栏人工智能头条

小团队撬动大数据——当当推荐团队的机器学习实践

2439
来自专栏ATYUN订阅号

世界上最大的大脑:拥有一百万个处理核心的神经形态计算机

科学家刚刚激活了世界上最大的“大脑”:一台拥有一百万个处理核心和1,200个互连电路板的超级计算机,它们像人脑一样运作。科学家宣布,这是世界上最大的神经形态计算...

921
来自专栏云飞学编程

Python全栈开发实战!看大神一节课带你做一个自己的音乐网站

都知道python现在很火,很有发展,都想来学习python,从事python相关职业,可是我们学了python到底要干什么呢?

1782
来自专栏人工智能快报

IBM新软件为深度学习提供支持

“supercomputingonline.com”发布消息称,IBM公司正在利用其新软件为深度学习提供支持。 IBM发布了基于Power Systems平台的...

2773
来自专栏人工智能头条

来自Google的经验:以用户为中心的机器学习七大技巧

1052
来自专栏量子位

谷歌再推AI开源平台AI·ON,你有机会参与Bengio的项目了

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 再次亮相。 首次推出一年后,谷歌又重新推出了AI开源项目讨论合作平台AI·ON(Artificial...

2936
来自专栏大数据挖掘DT机器学习

用户群体画像那些事儿

伴随着大数据应用的讨论、创新,个性化技术成为了一个重要落地点。相比传统的线下会员管理、问卷调查、购物篮分析,大数据第一次使得企业能够通过互联网便利地获取用户更...

53911
来自专栏AI科技大本营的专栏

终于能用Google的TPU跑代码了,每小时6.5美元

AI科技大本营消息,北京时间周一(2月12日)晚间,Google 宣布,在 Google Cloud Platform(GCP)上正式推出Cloud TPUs ...

45810

扫码关注云+社区

领取腾讯云代金券