专栏首页大龄程序员的人工智能之路数学不好,进入机器学习领域还有戏吗?

数学不好,进入机器学习领域还有戏吗?

自从Google的AlphaGo引爆了人工智能这个领域后,大量的人才开始涌入人工智能领域,各大公司也都开始布局人工智能方向。看一个领域的火爆程度,直接看相关职位的招聘人数和平均薪酬即可。就拿各大公司的校招广告来说,对于人才的争夺也是蛮拼的。下图是2018年企业校招的薪酬表:

在互联网上也疯传如下的数据:

看到这样的数据,我真的是相当惭愧,刚毕业的学生,AI方向的都是30万年薪起步,这让多年奋斗在计算机行业的我情何以堪。羞愧之余,内心也有点不服气,既然这个领域前景这么好,我为什么不能转向这个领域。

于是我也采取了行动。AI领域最火的无疑是深度学习,网上很多人推荐从李宏毅的这份《Deep Learning Tutorial》PPT入手。这份资料在网上流传很广,很容易的就找到了。接下来就是专心学习,看到这里(如下图)

感觉还是比较好理解的,然而看到这里:

这都是啥东东?再往后看,就越看越懵了。去知乎、Google兜了一圈,大家的观点比较一致,进入AI领域需要有很好的数学基础,入门的姿势是从《线性代数》、《概率论》学起。

天哪!虽然大学里也学过线性代数、概率论与数理统计的课程,可在当时就是学的就晕乎乎的,更何况过了这么多年,完全没有用过,要捡起来谈何容易。面对这样的现实,有点茫然,不知道该不该转向机器学习领域。

最近读了一本科幻小说《三体》,里面有一段有写到,人类基础科学被智子锁死,无法取得进展,但人类并没有停止进步,在工程方面获得了长足发展,也建造出了庞大的太空舰队(虽然在三体文明面前仍然不堪一击)。由此联想到人工智能领域,算法相当于人工智能的基础科学,人工智能在各个行业中的应用则属于工程领域,既然搞AI算法是没戏了,做做AI应用应该还是可以的吧。

其实基础科学领域的进展是相当缓慢的,比如计算机结构直到今天还没有突破冯·诺伊曼结构,要知道这可是在上世纪四十年代提出的。AI的科学基础线性代数、概率论等在几十年前就已经发展得非常完备,这里面大量的知识都是在上世纪初建立的。

初步思考了一下,作为开发人员,AI领域界可分成下面几个层级:

  • 科学家(专家) IT巨头对人工智能科学家的争夺可谓不遗余力,为什么他们这么值钱呢?从工作上讲,他们需要有深厚的理论知识,建立优秀的模型,并试图从理论上诠释模型,甚至将理论研究向前推进一步。从人数上看, 能够做到这一步的人,可以说凤毛麟角,天赋是绕不过去的大山,机遇和努力也缺一不可。
  • 算法实现及改进者 现在市面上已经涌现出了大量的AI框架,比如Tensorflow、Caffe等,这些就是他们的功劳。他们一方面需要有足够的理论知识,同时有具有很强的技术,能够将模型实现出来,或者根据经验提出一些改进的模型。这些人通常都是各个机器学习巨头公司的中坚力量,需要有扎实的理论知识,同时在架构设计、系统优化方面有着丰富的经验。这个群体要比科学家群体要大的多,但显然也不会太多,同样也是各大巨头争夺的对象。 这个群体中还有一类人,他们拥有深厚的人工智能专业知识,同时又对应用领域有足够的理解,比如AlphaGo团队的黄博士,本身是人工智能方面专家(但还谈不上科学家),同时又是业余围棋六段,对围棋有足够的理解,所以在围棋AI设计与改进过程中发挥了至关重要的作用。
  • 算法应用者 其实我们身边已经有很多人工智能的黑科技,比如P图、兴趣推荐、语音识别,这些林林总总的应用构建了大众可以感受到的产品。这些产品就是出自这一群体之手,这些人基本上不会在算法领域涉入太深,只需了解一下各个算法的实现,各个模型的结构,使用一些开源框架。他们更多的工作是结合实际的应用领域知识,比如图像处理,在行业中应用人工智能。 对于大部分IT人来说,最多在这一群体打转,但我们也不能因此而不屑于参加进来。要知道,腾讯既没有OS,也没有CPU,就凭借APP,同样构建了一个庞大的帝国。

想明白了这一点后,我也只能加入第三类人群中排队进场,能做一个AI领域的码农不也是挺好的吗?

在做了一些功课之后,我决定从如下两本书入手:

  • 《机器学习实战》(英文版:Machine Learning in Action)

从书名就可以看出,这是一本实践多过理论的一本书。这本书没有从理论角度来揭示机器学习算法背后的数学原理,而是通过“原理简述+问题实例+实际代码+运行效果”来介绍每个算法。这非常对我这样实战派的胃口,边学边用,以代码说话。 开始本书学习的前提条件也非常简单,只需对python语言有基本的了解。不需要Linux、不需要GPU,只要有python编程环境就可以开始,对开发人员相当友好。 本书附录部分还非常贴心的附加了Python入门、线性代数、概率论方面的基础知识,毕竟要理解一些算法,还是需要一点点基础知识的。

  • 《机器学习》(作者:周志华)

这本书被网友亲切的称为西瓜书,也是被很多人大力推荐的。但这本书是一本教科书,而且是一本入门的教科书。其宗旨是理清基本概念、了解领域概貌。就像人们到了一个陌生的地方,首先需要去找张地图,大致弄清楚哪里是山、哪里有水、自己身处何处,然后才好到具体区域去探索。所以这本书更多是让人“观其大略”,对各种算法都有大体的介绍,但都没有深入。 虽然作者试图尽可能少的使用数学知识,但相比《机器学习实战》,这本书的数学公式还是多了不少,对读者的要求也要高一些,读起来要吃力一些。这本书也没有涉及算法的实现,不需要编程方面的知识。

个人觉得将两本书结合起来看比较好,所以在以后一段时间内我将同时学习这两本书,如果学习中碰到什么问题,有什么心得,也会写出来和大家分享。

本文分享自微信公众号 - 云水木石(ourpoeticlife),作者:云水木石

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2018-03-09

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI会抢夺修图师的工作吗?

    作为一名业余摄影爱好者,在发图之前通常会使用软件处理一下,也就是俗称的 P 图。如果时间比较紧张、或者不重要的图,不会花费多长时间,加个滤镜,调一下色调,几十秒...

    云水木石
  • AI.未来

    轰轰烈烈的双十一购物狂欢终于过去了,你的荷包是不是轻了好几吨?不知道你有没有被各种优惠、满减整的头晕脑胀,反正我是晕了。想想现在都已经是人工智能时代了,一二十年...

    云水木石
  • Neural Network Basics习题解析

    昨天做完卷积神经网络习题,感觉自己都弄懂了,但到编程环节,却感觉无从下手,勉强参照示例代码完成编程任务,提交了好几次都没有通过,倍受打击。简单总结了一下原因:

    云水木石
  • NSURLSession代码

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u010105969/article/details/...

    用户1451823
  • VR App排名第一的3D播播又升级了,听说这次的亮点是解放双手完美沉浸?

    VRPinea
  • 思科前高管汇聚一堂,“MPLS”又添新成员

    据悉,思科前运营执行副总裁Randy Pond将担任Pensando Systems的首席财务官,Pensando Systems是一家网络初创公司。Pond证...

    SDNLAB
  • MySql获取所有表名

    如何获取MySql中所有表的的表名?  sql语句是:show tables 返回结果如下: ? 不仅仅返回了所有的表名,更返回了视图的名字。

    码农阿宇
  • Python中的交叉分析pivot_table

    交叉分析 通常用于分析两个或两个以上,分组变量之间的关系,以交叉表形式进行变量间关系的对比分析; 从数据的不同维度,综合进行分组细分,进一步了解数据的构成、分...

    Erin
  • Golang的简单IOC框架 go-summer

    Summer是一个Golang的简单的IOC框架。 实现了基本的依赖注入,配置文件属性注入等。 易扩展,简单。 简单的示例代码如下: ? ? ?

    李海彬
  • 机器学习特征提取 | 自动特征工程featuretools

    1、什么是Featuretools? 为了能使框架普适,就像pandas用于数据准备或scikit-learn用于机器学习。 链接:https://www.fe...

    深度学习思考者

扫码关注云+社区

领取腾讯云代金券