人工智能工程师学习学习路线图

入门前需要的几种技能:

统计学

要深入理解机器学习,必须要有扎实的统计学基础知识,这涉及到几个方面:

1、度量模型是否成功的各种方法(精确度、召回率、ROC曲线下面积等)。损失函数和评估指标的选择是如何**偏离模型的输出**的。

2、如何理解**过拟合**和**欠拟合**,以及**偏差/方差折衷**。

3、你对模型的结果有什么样的**信心**。

机器学习理论

在训练神经网络的时候,实际上发生了什么?是什么使得某些任务可行,而其他任务不可行?要弄清楚这些问题,最好的方法不是深入研究理论知识,而是试着通过图形和示例来了解机器学习。

需要理解的概念范围包括:不同的**损失函数**的工作原理是什么、为什么**反向传播**是有用的、**计算图**是什么。而对于**如何建立一个功能模型**,以及**如何跟团队里的其他人员进行有效地交流**,这些都需要深入地理解。

另一个基本技能是阅读、理解和实施论文的能力。这个一开始做起来可能会感觉比较困难,所以最好的方法就是阅读附带代码的论文(例如,研究GitXiv上的论文),并试着去理解它是如何实现的。

数据处理

如果你去问任何一个数据科学家他们的主要工作是什么,他们会告诉你,90%的工作是数据处理。这与应用AI同样重要,因为模型的成功与否与数据的质量(和数量)强相关。数据工作包含多个方面,但可归纳为下面几类:

数据采集(包括:找到好的数据源、准确度量数据的**质量**和**分类**、获取和推断标签)数据预处理(**缺失数据**填补、**特征工程**、数据**增强**、数据**规范化**、交叉验证分割)数据后处理(使模型的输出可用、清理工作、处理**特殊情况**和**异常值**)熟悉数据处理工作最好的方法是获取一个数据集并试着使用它。有很多在线数据集,以及很多提供API的社交媒体和新闻媒体网站。基于上面提到的几个步骤,我们可以这样进行学习:获取一个开源的数据集,并对其进行检查。它有多大(点和特征的数量)?数据如何分布?是否存在缺失值或异常值构建一个将原始数据转换为可用数据的转换流程。如何填补缺失值?如何正确处理异常值?如何规范化数据?能创造出更多的表现特征吗?

软件工程

许多的应用机器学习允许你充分发挥自己在软件工程方面的技能,虽然有时也会有一点小改变。这些技能包括:

测试流水线的各个方面(数据的预处理和增强、输入输出的整理、模型推理时间)。基于**模块化**和可重用的原则来构建代码。在训练过程中的不同点对模型进行备份(**设置检查点**)。配置一个**分布式的基础架构**,这样能更加有效地进行训练、超参数搜索或者推演。

原文发布于微信公众号 - 机器人网(robot_globalsources)

原文发表时间:2018-05-28

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

一文看懂深度学习新王者「AutoML」:是什么、怎么用、未来如何发展?

技术博客TowardDataScience有一篇文章,就全面介绍了关于AutoML和NAS你需要了解的一切。

2822
来自专栏ATYUN订阅号

深度学习研究:微软认知转移神经元(CSN)技术,创建适应性元学习模型

适应性是将我们定义为人类的关键认知能力之一。即使我们没有事先对婴儿进行训练,也可以在相似的任务之间直观地切换。与大多数人工智能系统的传统训练和测试方法对比,无...

1377
来自专栏PPV课数据科学社区

【译】从文本挖掘和机器学习中洞悉数据

版权申明 作者:Murat Yazici 原文链接:http://www.ibmbigdatahub.com/b ... rning 翻译:星星 ...

2839
来自专栏人工智能头条

解密谷歌机器学习工程最佳实践——机器学习43条军规

1883
来自专栏算法channel

TensorFlow笔记|为什么会有它?

本系列推送主要参考: Stanford University CS20SI: Tensorflow for Deep Learning Research. 01...

3816
来自专栏AI研习社

无需编程,仅用摄像头,Google 最新项目让你 3 分钟学会机器学习 | 雷锋网

得益于各种套件,今天的机器学习的门槛已经越来越低。但 Google 显然并不满足于此,其最新推出了 Teachable Machine 项目,让用户无需编程就可...

36610
来自专栏技术翻译

8个深度学习框架

随着越来越多的企业希望扩大其运营规模,它们已成为接受机器学习和预测分析的必要条件。人工智能与正确的深度学习框架相结合,真正放大了企业在其领域内可以实现和获得的整...

2093
来自专栏ATYUN订阅号

谷歌为离线设备开发AI系统SGNN,短文本分类准确率达到86.7%

深度神经网络是最先进的机器翻译和目标识别系统的核心。它们有助于将一种语言翻译成另一种语言并从名片中提取地址。问题是,它们经常受到智能手机,可穿戴设备和其他移动设...

1032
来自专栏AI研习社

谷歌开源物体检测系统 API (附代码下载地址)

AI 研习社按:近日,谷歌在其“谷歌开源”博客(Google Open Source )中发表一篇名为《Supercharge your Computer Vi...

3993
来自专栏算法channel

BAT面试题13:请简要说说一个完整机器学习项目的流程

随着机器学习(ML)成为每个行业的重要组成部分,对机器学习工程师(MLE)的需求急剧增长。MLE需要将机器学习技能与软件工程专业知识相结合,为特定应用程序找到高...

1393

扫码关注云+社区

领取腾讯云代金券