AI时代就业指南:机器学习工程师求职须知

什么是机器学习?

我们来看一下机器学习是做什么的,能解决什么问题。

首先我们来看机器学习的一个类型,监督学习。

蓝色箭头部分是训练一个机器学习模型的过程。首先有Input,包括原始数据和Labels。然后把原始数据转化成Feature Vectors,将其与Labels结合到一起,通过机器学习算法,训练出一个预测模型,这就完成了Training的部分。

再看绿色箭头部分,同样首先有Input,包括一些数据,同样把他们转化为Feature Vector,然后通过刚刚产生的模型,预测出Expected Label。这叫做有监督模型。具体来看,会用到回归(Regression)和分类(Classification)

机器学习算法的另一类是无监督学习。

同样是用Input Data训练一个模型,然后根据新的Data做预测。它和有监督学习不同的是,在训练模型的部分里没有Label。具体是用到Clustering和Dimensionality Reduction。

机器学习算法大致包括三个成分

Hypothesis, Loss, Optimization。Hypothesis的目的是想要找到输入数据与输出数据的关系。Loss是想要评估和量化假设的好坏与否。而Optimization是想要使得Loss最小,找到合适的模型。

机器学习工程师做什么?

可以把机器学习工程师的工作分为以下几点:

  • 机器学习的实现和搭建各个公司的机器学习架构。
  • 搭建架构之后,维护该架构,包括在新的数据局进来时,该架构的速度、可靠性和性能。
  • 开发内部机器学习框架并抽象出来以推动其正常任务运行,例如training / testing, feature use / reuse / creation /storage/deployment等。这些框架不仅被机器学习工程师使用,也会被数据科学家使用。

实际上,机器学习工程师的工作也取决于具体的公司,不同的公司对机器学习的理解和应用不一样,因此他们的机器学习工程师的工作职责也会不一样。

机器学习工程师所需的技能

首先,Machine Learning Engineer仍然是engineer,所以计算机基础知识和编程能力是必须有一定水准的,所以第一和第五点是基础。此外,说到用于研究和进行ML其它的一些算法工作,数学、概率、统计知识也是必不可少的;更进一步的要求是,需要数学建模和数据评估知识,还要懂得Machine Learning算法和如何用Libraries去实现你的idea。

而关于其中第五点,之所以System Design能力在Machine Learning Engineer中仍然很重要,就是因为Machine Learning的发展,是很大一部分得益于计算能力的增强。犹记得在Google里100多人的TensorFlow的团队中,每一个参与开发该框架的成员,都对于System Design非常精通。

通常来说,普通的Software Engineer 和 Machine Learning Engineer更多只会用到图上第一和第五点技能,但是要成为 Core Machine Learning Engineer 的话,对于3,4项技能的依赖会越来越大。

关于机器学习的求职须知

机器学习涵盖的领域非常广,包括三大块,计算机视觉、自然语言处理、以及类似系统GPU的内容,其中又可以分为无数小块。只要根据个人的兴趣,找准一个方向切入进去,目前市面都会有大把的工作机会。

以百度的Job Description举例:

首先,前三点都是要求要有数据结构和算法的能力,基本也适用于Software Engineer。但是,注意其中一点,不同公司对于不同语言会有要求,所以投简历前一定要详细的看公司的Job Description。在百度,如果要求应聘者拥有 C++ 的技能,那么在面试的时候就一定会出现C++的内容;而有的公司或许要求SQL,R等语言,都是一样;最后一点,线性回归,概率论、统计、中枢网络等,是对于ML工程师的特殊要求。

原文发布于微信公众号 - PPV课数据科学社区(ppvke123)

原文发表时间:2017-10-10

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏杨熹的专栏

纯粹的数学之美

当你爱上数学时,你可能愿意一辈子去研究它而不觉得厌烦,因为它的发展集成了无数人的贡献,自身是博大精深的,但输出却是简单的,简单到一个公式可以描述一个现象,一个方...

374100
来自专栏AI科技大本营的专栏

如何入门Python与机器学习

本文引自电子工业出版社《Python与机器学习实战》 本书算法与代码兼顾,理论与实践结合。很丰富:7种算法,50段实现,55个实例,总代码量5295行,全面而...

43760
来自专栏人工智能头条

这7种NLP黑科技让你更好交流!来看一看是什么(Part1)

10420
来自专栏AI科技评论

参会见闻系列:ACL 2018,在更具挑战的环境下理解数据表征及方法评价

AI 科技评论按:本篇属于「顶会见闻系列」。每年这么多精彩的人工智能/机器学习会议,没去现场的自然可惜,在现场的也容易看花眼。那么事后看看别的研究员的见闻总结,...

12910
来自专栏新智元

从神经科学到计算机视觉:人类与计算机视觉五十年回顾

【新智元导读】本文简单的介绍了神经网络近50年的发展历程,从1968年的Hubel和Wiesel开展的猫实验,一直到李飞飞教授等人的成果。从本质上讲解了人工神经...

34650
来自专栏机器之心

学界 | 一文综述所有用于推荐系统的深度学习方法

56280
来自专栏PPV课数据科学社区

空间数据挖掘常用的17种方法

PPV课大数据学习社区如果你对大数据感兴趣;如果你想转行做大数据;如果你想了解大数据是怎么改变我们生活,请点标题下蓝字关注PPV课大数据 ? 问题1:空间数据挖...

38890
来自专栏量子位

骗过70%的人!这个AI能自动给视频配音,真假难辨(不服来试)

安妮 发自 凹非寺 量子位 出品 | 公众号 QbitAI 先来做个“真假美猴王”的游戏。 视频内容 你将看到两段画面相同的视频,请判断哪段来自视频原声,哪...

41450
来自专栏量子位

LeCun亲授的深度学习入门课:从飞行器的发明到卷积神经网络

Root 编译整理 量子位 出品 | 公众号 QbitAI 深度学习和人脑有什么关系?计算机是如何识别各种物体的?我们怎样构建人工大脑? 这是深度学习入门者绕不...

36550
来自专栏互联网大杂烩

评价模型数据挖掘之评价模型

是定性与定量相结合的多准则决策、评价方法。将决策的有关元素分解成目标层、准则层和方案层,并通过人们的判断对决策方案的优劣进行排序,在此基础上进行定性和定量分析。...

22720

扫码关注云+社区

领取腾讯云代金券