实现财务自由,这个工作是我们未来几年最好的选择

5月8日,谷歌召开一年一度的Google I/O大会,谷歌CEO直接祭出了这次大会的王牌——AI。

在现场演示的整段对话中,Google Assistant表现的自然流畅,理发店那头丝毫没有察觉到,自己竟然是在和AI对话!

AI的发展正在以我们难以预期的速度突飞猛进,可以预见未来几年人工智能领域的竞争将会有多激烈。

近期由腾讯发布的报告显示,国内的AI人才缺口达100万甚至更多,而当前AI领域合格的研究人员仅有不超过30万人,数额差之大可见企业在AI领域的“求贤若渴”。

2018年以及未来的几年内,AI人才将是互联网企业发展的关键因素。

图片来源:腾讯研究院-全球人工智能人才白皮书

在这波巨大的热潮下,我们应该如何跻身AI领域快速实现自我呢?

AI领域并不仅仅包括机器学习。曾经,符号与逻辑被认为是AI实现的关键,如今则是基于统计的机器学习占据了主导地位。最近火热的深度学习正是机器学习中的子项。

目前可以说,学习AI主要就是学习机器学习。想要成为一名合格的机器学习工程师,不仅需要扎实的理论基础,而且需要丰富的项目实战经验。除了通用技能以外,需要掌握的技能还有很多,大概就是下图这样子的↓

(拉到文末获取高清图表)

对于机器学习工程师来说,想要入门,先得解决以下三个基础知识拦路虎。

基础一:数学基础

  • 线性代数和微积分基础
  • 统计学相关基础
  • 相关线性分析

基础二:编程基础

  • 掌握相关的编程语言,比如 C++ / Python / Go / Java 等,目前 Python 是机器学习深度学习领域最主流的编程语言,热的发烫。

基础三:机器学习的基础

  • 对基础概念的理解,比如拟合、关联规则(Apriori、FP-Growth)、回归(Linear Regression、Logistics Regression)、决策树(ID3、C4.5、CART、GBDT、RandomForest)、降维……等等。

在互联网领域从事机器学习的人,有下列两类背景的人比较多:

1.程序员出身,这类同学工程经验相对会多一些

2.学数学统计领域出身,这部分同学理论基础相对扎实一些。

因此对比上图,2类同学入门机器学习,所欠缺和需要加强的部分是不一样的。下面就上述图中的部分,展开来分别扯几句:

数学基础

机器学习相对于其他开发工作更有门槛的根本原因就是数学。基本所有常见机器学习算法需要的数学基础,都集中在微积分、线性代数和概率与统计当中。

典型算法

绝大多数问题用典型机器学习的算法都能解决,粗略地列举一下这些方法如下:

机器学习里所说的“算法”与程序员所说的“数据结构与算法分析”里的“算法”略有区别。

前者更关注结果数据的召回率、精确度、准确性等方面,后者更关注执行过程的时间复杂度、空间复杂度等方面。当然,实际机器学习问题中,对效率和资源占用的考量是不可或缺的。

编程语言、工具和环境

看了无数的理论与知识,总归要落到实际动手实现和解决问题上。对初学者而言,Python和R语言是很好的入门语言,很容易上手,同时有活跃的社区支持,丰富的工具包帮助我们完成想法。

基本工作流程

以上我们基本具备了机器学习的必要条件,剩下的就是怎么运用它们去做一个完整的机器学习项目。

工作流程如下: 抽象成数学问题—— 获取数据——特征预处理与特征选择——训练模型与调优——模型诊断——模型融合——上线运行。

这些工作流程主要是工程实践上总结出的一些经验,并不是每个项目都包含完整的一个流程。只有大家自己多实践,多积累项目经验,才会有自己更深刻的认识。

本文分享自微信公众号 - Crossin的编程教室(crossincode)

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-05-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器之心

专访 | 英特尔刘茵茵:持续优化NLP服务,助推人工智能创新和落地

机器之心原创 作者:邱陆陆 去年六月,英特尔人工智能产品事业部(AIPG)数据科学主任、首席工程师刘茵茵在机器之心主办的第一届全球机器智能峰会(GMIS 201...

30870
来自专栏人工智能头条

京东DNN实验室:大数据、深度学习与计算平台的实践

22440
来自专栏应兆康的专栏

10. 用开发集和评估指标来加速迭代

对于一个新问题,事先是很难知道用什么方法解决它是最合适的。即使机器学习经验丰富的研究员也需要尝试许多,才能得到令自己满意的东西。在构建机器学习系统时,我经常会:

33480
来自专栏华章科技

一文读懂机器学习、数据科学、人工智能、深度学习和统计学之间的区别

在这篇文章中,数据科学家与分析师 Vincent Granville 明晰了数据科学家所具有的不同角色,以及数据科学与机器学习、深度学习、人工智能、统计学等领域...

15720
来自专栏杨熹的专栏

开启聊天机器人模式

聊天机器人系统框架图 今天看到了一篇关于聊天机器人的一个不错的资源汇总: https://www.52ml.net/20510.html 进去看看先大概了解了...

450110
来自专栏PPV课数据科学社区

如何做好数据挖掘模型的9条经验总结

当前的数据挖掘形式,是在20世纪90年代实践领域诞生的,是在集成数据挖掘算法平台发展的支撑下适合商业分析的一种形式。也许是因为数据挖掘源于实践而非理论,在其过程...

29750
来自专栏机器之心

业界 | 让人工智能学会谈判,Facebook开源端到端强化学习模型

选自code.facebook 机器之心编译 参与:吴攀、李亚洲 每天从我们醒来的那一刻,生活中就充满了经常性的谈判(negotiations)。这些场景包括讨...

353110
来自专栏AI科技大本营的专栏

方兴未艾的语音合成技术与应用

作者简介:李秀林,中国科学院博士,15 年语音相关技术研发和学术研究,申请专利三十余项,在国内外语音界有很高的知名度;曾带领团队获得百度百万美元大奖。2006 ...

22240
来自专栏人工智能头条

Yann LeCun高端私享会纪实:预测学习才是AI的未来

18830
来自专栏应兆康的专栏

10. 用开发集和评估指标来加速迭代

22910

扫码关注云+社区

领取腾讯云代金券