AI Insight：放弃幻想，搞 AI 必须过数学关

CreateAMind

发布于 2018-07-24 18:13:46

1K0

发布于 2018-07-24 18:13:46

文章被收录于专栏：CreateAMind

从2012年“大数据”概念兴起到2016年人工智能大热，已经四五年时间了，该看的热闹看到了，该爆炒的话题炒够了，该沉淀的也沉下来了。现在越来越多的人已经放下质疑，相信这一届 AI 确实靠谱，该找找门道了。最近好多关注 AI 的公众号都发表了文章谈数学学习的问题，这就真的上道了。如果你是技术人员，特别是程序员，想成为 AI 工程师，那么只要你稍微花点时间研究一下 AI 的门道，就会意识到，主要的拦路虎是数学。如果你看到有人说什么不懂数学也能搞 AI，那你可能要警惕，因为这很可能是一种误导。

一定要认识到一点，数据科学、机器学习、DT、AI，whatever，不管你叫什么，它不是 IT 行业中又一项新技术，而是一个新行业。马云说 IT 时代结束了，DT 时代开始了，有点标题党，但大意是对的。

我们要充分认识到，这不是一次 paradigm shift（范式转换）。游戏没变，规则变了，那是 paradigm shift，连游戏都变了，那就是 game shift 了。比如说，对于商业来说，互联网是一次 game shift，但对于 IT 行业来说，从企业网 C/S 架构走向互联网 Web 架构，平台变了，工具变了，协议变了，模式变了，赚钱的规则也变了，但事情的本质没变，还是在网络上构造商业管理和通讯系统。所以面向对象是 paradigm shift，敏捷是 paradigm shift，Web 是 paradigm shift，移动互联网开发是 paradigm shift。而 AI 不是 paradigm shift，是 game shift。

新行业有新玩法。AI 跟 IT 技术的主要差别是什么？简单的说，就是 AI 对数学要求较高，对编程要求较低，而 IT 开发对于编程要求高，特别是对编程经验要求高，但对数学要求不高。

“大学工科数学三板斧”

说一个秘密，全世界的程序员两千万，大多数手持大学学历，外行人以为他们的数学都得要好，但其实大部分人对于大学数学三板斧微积分、线性代数和概率统计的记忆已经基本清零。除了专业从事有关领域的底层技术开发人员，大多数程序员、架构师、软件工程师、项目经理甚至相当多的 CTO，对于什么方向导数和梯度、函数项级数的一致收敛、魏尔斯特拉斯定理、拉格朗日乘数法、矩阵特征值与特征向量、矩阵二次型、多维随机变量条件分布之类的大学数学基本概念，实际已经陌生如听天书了。这无可指责，因为这些东西在实际产品设计、系统开发和运维当中根本用不着。他们必须将主要精力投入到“广义计算机语言”的学习当中，适应所谓“热门驱动开发（Hype Driven-Development）”，包括一门又一门最新最火的编程语言，一个又一个网络协议，成百上千的 API 用法，各种框架、平台、数据库、操作系统和浏览器的方言、怪癖甚至陷阱，还有设计模式、架构模式、版本管理、build system、container、DevOps，等等等等，内容实在是太繁杂了，变化实在是太多了，风潮转换实在是太快了，耗费精力实在是太大了。哪有时间搞没用的东西？连算法都只是在准备跳槽刷题时才需要认真对待的，数学？一边凉快去吧。

“三板斧之后”

然而搞 AI 就完全是另一回事，关键是数学。大学工科数学？那只是一个基础，想再搞懂 AI 的那些基本的算法和思想，你不但需要把这三板斧基础打扎实，而且还需要学习矩阵分析和凸优化。这只是一个入门，想要在这个领域有点建树，你可能还需要在随机过程、泛函分析、微分流形、数值分析和优化理论等领域进一步深造。想要搞机器人学或自动驾驶？还得研究微分方程、运动学、动力学。毫不夸张的说，在 AI 学习的入门阶段，数学是主要的攻坚对象，任何胸有大志的 AI 学习者都不要幻想绕过数学。

可能正是因为数学是一只拦路虎，最近我们看到了不少鸡汤文章出来安慰说数学不好也可以学 AI。这些文章，大多只是标题党，你以为他给你指了一条方便法门，其实打开一看，只不过是舒缓你的畏难情绪，推荐几本寓教于乐的数学书，给你做做心理按摩，本质上还是一句话：想搞 AI，就得把数学拿下。但是很多人现在看文章只看标题啊，所以就产生了幻想，是不是不学数学也能搞 AI呢？有没有可能把数学都交给封装好的框架和程序库，我只做调用和调试的工作呢？未来会不会达到 AI 工具化、AI 工具傻瓜化的程度呢？

AI 工具化可能性是有的，而且是必然，趋势很明显。比如著名的机器学习框架 scikit-learn，把多种机器学习算法包装成他们所说的“黑盒子”，使用时只需要选择算法，设置合适的参数进行初始化，然后灌数据训练模型，得到模型以后就可以进行分析和预测了，大多数复杂性都被包装在后面。而现在当红的深度学习，这个趋势更加明显。在张重生所著的《深度学习——原理与应用实践》一书中，作者援引周志华教授的一段话，吐槽当前深度学习现状说：

“有点幽默，但很朴实，深度学习现在差不多就是民工活，调来调去，刷来刷去。文章发得飞快，貌似热闹，但有多少是能沉淀下来的实质真进展、真原理、真算法、真技术，又有多少是换个数据就不靠谱了的蒙事撞大运？既缺乏清澈干净的内在美感，又不致力于去伪存真、正本清源，只图热闹好看，迟早把 arXiv 变成废纸堆。”

通过这段吐槽，我们侧面了解到深度学习这个领域当前的局面，极少人做核心理论研究，一小部分人开发框架和程序库，大多数人只是把黑盒子拿来刷参数、攒论文。我们从正面的意义上来理解这件事情，这恰恰表明深度学习的工具化做得比较好，初步形成了一个金字塔模型。专家们批评的，只不过是现在很多金字塔底层的“深度学习民工”在利用 AI 的热潮和外界对这个领域的不了解沽名钓誉，导致某些 AI 人士所说的“深度学习泡沫”。批评归批评，这个人员分布结构是合理的，AI 工具化是有效的。

所以，是的，机器学习和 AI 领域的软件工具也会逐渐走向成熟，也会像黑盒子一样把很多复杂性包装起来，把很多今天需要较深数学理解才能做到的事情简化为调参。但是这是否就能让我们得出结论说，未来的 AI 工程师可以不懂数学呢？

当然不能。首先，数学不过关的人在 AI 这个圈子里是无法参与交流的，或者说得直白一点，是被人瞧不起的，根本无法被接纳成为AI 圈子里的人。其次，数学不过关而只能调参数的人，实践当中并不好用。我接触过几个 AI 创业企业，他们都疯狂的缺人，但是对于不懂数学只会使用工具的“人才”，他们却大门紧闭。什么原因？沟通效率低，出活慢，遇到问题无法解决，一句话，“不好用”。第三，即便是调参这件事情本身，懂不懂数学也是有很大差别的。因为调参是一个跟自己较劲的过程，不断地划分训练数据集和验证数据集，调整参数，追求更高的准确率，又要防范过拟合，一遍又一遍，本身就是非常繁琐和枯燥的工作。如果你数学不过关，对参数的意义和相关关系理解不深，方向感不强，只能半随机的去刷参数，那么工作的单调性和烦琐性还会大大上升，很难坚持到做出好的模型来。

就这三点，决定了不懂数学的“AI框架调参工”不会是一个令人向往的工作。我绝不相信一个年轻人满怀 AI 梦想走进这个行业，会满足于做一个“以其昏昏使人昭昭”的调参工。

所以，结论已经很清楚，想搞 AI，数学必须过关。一切与这个结论有冲突的说法，都是耍流氓。

当然，请注意我在这里说的是“数学必须过关”，只要求过关，并不是要求你为了搞 AI 而先要变成一个数学家，那既不现实也不必要。为什么只要求过关呢？为什么不是数学越棒越好呢？因为 AI 要在数学上形成重大的突破，可能是十年甚至几十年一遇的。今天机器学习中有效的数学方法，绝大多数都是几十年前做出来的成果。因此做 AI 工程，重点是充分理解、熟练掌握和运用这些成熟的数学工具，尊重分工，把数学领域的创新交给数学家和应用数学家。

机器学习学者张志华教授曾经说过：“搞好机器学习，关键是数学，但你又不能把机器学习变成搞数学，那样就漫无边际了。”数学浩瀚如海，神灵通天，我们还是要敬畏数学之神，不要毫无目标、不计成本的扩大数学的钻研，而是要把握好度。对于绝大多数 AI 工程师来说，还是应该以机器学习为主导，对于其中涉及的数学知识形成理解，打牢基础，突出重点，适度拓宽，这就算过关了。以后根据主攻方向，随用随学，急用先学，这样就可以了。

数学过关以后，还得懂编程语言、系统架构、数据库、异构平台上的高性能计算，要成为一个优秀的 AI 工程师，这些都得通。吴恩达就说过，深度学习的前沿是高性能计算。因为数学的进展是可遇而不可求的，而软硬件的进步是线性的甚至指数的，是一趟快车。你想冲在前沿，得搭上这趟快车。如果你只是数学好，编程和工程化能力不行，所能做的事情就比较有限，需要一个强有力的工程团队来支持你。实际上，我就知道一些学院派的 AI 人士，他们的数学背景很好，但是编程玩得不溜，下面的学生又不给力，只能封闭在“数学—Matlab—论文” 这个三角里，对他们来说，编程成了一个障碍。

但是对于一个有一定经验的程序员而言，编程是优势。前不久，我向一个在国内 AI 界有点名气的新锐 AI 科学家了解情况，他们手上的深度学习项目使用 Python 和 C++ 语言开发，都是基于开源的深度学习框架，但自己的工程师也要做相当程度的调整和改进。那么他们对于工程师编程语言的掌握程度有多高的要求呢？Python 语言不需要自己设计 class，就更不用提什么 decorator, metaclass, asyncio 了，C++ 只要求看懂框架代码当中核心的部分，只有很少的人需要去修改 C++ 代码。这里头真正有点挑战的，是要熟练掌握 Python 标准库和一些流行包中的 API 用法，快速完成数值计算、数据清洗、数据可视化等工作，这是需要时间去熟悉和掌握的。但有经验的人知道，这些可以边做边熟悉，不是什么硬约束。如果你在“城头变幻大王旗”的开发界混过几年，转行搞 AI，你的编程能力绝对是下山猛虎，完全不必担心。你真正要过的，就是数学关。只要你过了数学这关，后面将数学理解、工具框架、数据资源和应用结合起来形成正向循环，就可以一步一步的攀爬 AI 的高峰了。

本文为 AI100 原创，转载已获同意。

本文参与腾讯云自媒体同步曝光计划，分享自微信公众号。

原始发表：2017-02-08，如有侵权请联系 cloudcommunity@tencent.com 删除

人工智能