学术丨周志华:机器学习有这两大派别,新人入门别跟错队

AI 科技评论按:继移动互联网之后,人工智能技术已经席卷全球。2017 年 3 月 3 日,中国人工智能学会(CAAI)将举办 AIDL2《机器学习前沿》会议,邀请了南京大学的周志华教授担任学术负责人,他届时也将在会议上发表致辞。而在今年 7 月份的 GAIR 大会上,AI 科技评论也将邀请周志华教授进行主题演讲的分享。

周志华教授是 ACM Fellow(美国计算机学会会士),AAAS Fellow(美国科学促进会会士),AAAI Fellow(国际人工智能学会会士),IEEE Fellow(国际电气电子工程学会会士),IAPR Fellow(国际模式识别学会会士)。中国人工智能学会机器学习专业委员会前任主任,南京大学计算机软件新技术国家重点实验室常务副主任。在一流国际期刊和顶级国际会议发表论文 100 余篇,被引用逾两万次,H-index 73,被列入计算机领域 H-index 最高的前 100 位学者。

机器学习作为近年来非常火的一个概念,关注者追随者甚众,然而它的渊源及由来却鲜有人知晓。在这篇周志华老师写就的文章中,AI 科技评论将带领大家一睹机器学习的两大派别,领略其在历史长河中的变迁和进步。本文由 AI 科技评论编辑,并做了不改动原意的修改。

机器学习现在是一大热门,研究的人特多,越来越多的新人涌进来。不少人其实并没有真正想过,这是不是自己喜欢搞的东西,只不过看见别人都在搞,觉着跟大伙儿走总不会吃亏吧。

问题是,真有个「大伙儿」吗?就不会是「两伙儿」、「三伙儿」?如果有「几伙儿」,那到底该跟着「哪伙儿」走呢?

很多人可能没有意识到,所谓的 machine learning community,现在至少包含了两个有着完全不同的文化、完全不同的价值观的群体,称为 machine learning “communities ”也许更合适一些。

第一个 community,是把机器学习看作人工智能分支的一个群体,这群人的主体是计算机科学家。现在的「机器学习研究者」可能很少有人读过 1983 年出的「Machine Learning: An Artificial Intelligence Approach」这本书。这本书的出版标志着机器学习成为人工智能中一个独立的领域。它其实是一部集早期机器学习研究之大成的文集,收罗了若干先贤(例 如 Herbert Simon,那位把诺贝尔奖、图灵奖以及各种各样和他相关的奖几乎拿遍了的科学天才)的大作,主编是 Ryszard S. Michalski(此君已去世多年了,他可算是机器学习的奠基人之一)、Jaime G. Carbonell(此君曾是 Springer 的 LNAI 的总编)、Tom Mitchell(此君是 CMU 机器学习系首任系主任、著名教材的作者,机器学习界没人不知道他吧)。Machine Learning 杂志的创刊,正是这群人努力的结果。这本书值得一读。虽然技术手段早就日新月异了,但有一些深刻的思想现在并没有过时。各个学科领域总有不少东西,换了新装之后又粉墨登场,现在热火朝天的 transfer learning,其实就是 learning by analogy 的升级版。

人工智能的研究从以「推理」为重点到以「知识」为重点,再到以「学习」为重点,是有一条自然、清晰的脉络。人工智能出身的机器学习研究者,绝大部分 是把机器学习作为实现人工智能的一个途径,正如 1983 年的书名那样。他们关注的是人工智能中的问题,希望以机器学习为手段,但具体采用什么样的学习手段,是基于统计的、代数的、还是逻辑的、几何的,他们并不 care。这群人可能对统计学习目前 dominating 的地位未必满意。靠统计学习是不可能解决人工智能中大部分问题的,如果统计学习压制了对其他手段的研究,可能不是好事。这群人往往也不 care 在文章里 show 自己的数学水平,甚至可能是以简化表达自己的思想为荣。人工智能问题不是数学问题,甚至未必是依靠数学能够解决的问题。人工智能中许多事情的难处,往往在于我们不知道困难的本质在哪里,不知道「问题」在哪里。一旦「问题」清楚了,解决起来可能并不困难。

第二个 community,是把机器学习看作「应用统计学」的一个群体,这群人的主体是统计学家。和纯数学相比,统计学不太「干净」,不少数学家甚至拒绝承认统计学是数学。但如果和人工智能相比,统计学就太干净了,统计学研究的问题是清楚的,不象人工智能那样,连问题到底在哪里都不知道。在相当长时间里,统计学家和机器学习一直保持着距离。慢慢地,不少统计学家逐渐意识到,统计学本来就该面向应用,而机器学习天生就是一个很好的切入点。因为机器学习虽然用到各种各样的数学,但要分析大量数据中蕴涵的规律,统计学是必不可少的。统计学出身的机器学习研究者,绝大部分是把机器学习当作应用统计学。他们关注的是如何把统计学中的理论和方法变成可以在计算机上有效实现的算法,至于这样的算法对人工智能中的什么问题有用,他们并不 care。

这群人可能对人工智能毫无兴趣,在他们眼中,机器学习就是统计学习,是统计学比较偏向应用的一个分支,充其量是统计学与计算机科学的交叉。这群人对统计学习之外的学习手段往往是排斥的,这很自然,基于代数的、逻辑的、几何的学习,很难纳入统计学的范畴。

两个群体的文化和价值观完全不同。第一个群体认为好的工作,对于第二个群体而言可能觉得没有技术含量,但第一个群体可能恰恰认为,简单的才好,正因为很好地抓住了问题本质,所以问题变得容易解决。第二个群体欣赏的工作,第一个群体可能觉得是故弄玄虚,看不出他想解决什么人工智能问题,根本就不是在搞人工智 能、搞计算机,但别人本来也没说自己是在「搞人工智能」、「搞计算机」,本来就不是在为人工智能做研究。两个群体各有其存在的意义,应该宽容一点,不需要去互较什么短长。但是既然顶着 Machine Learning 这个帽子的不是「一伙儿」,而是「两伙儿」,那么要「跟进」的新人就要谨慎了,先搞清楚自己更喜欢「哪伙儿」。

引两位著名学者的话结尾,一位是人工智能大奖得主、一位是统计学习大家,名字我不说了,省得惹麻烦:

  • 「I do not come to AI to do statistics.」
  • 「I do not have interest in AI.」

附:近期由周志华老师担任学术主任的《人工智能前沿讲习班》于近日开班,其主题为《机器学习前沿》,借用周老师最近在CNCC2016的总结:“深度学习可能有寒冬,但机器学习不会有冬天”。欢迎对机器学习感兴趣的同学点击“阅读原文”查看详细信息。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-02-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据的力量

如何建立自己的思维方式

1368
来自专栏华章科技

机器将拥有常识?Hinton预言十年内将研发出具有常识的计算机

【新智元导读】机器会拥有常识吗?Hinton说,Yes,并且会在10多年内变成现实。两位从经济学的视角观察AI问题的学者为此打了一个赌,支持者对反对者的赔率为5...

543
来自专栏机器之心

专栏 | 香侬科技独家对话斯坦福大学计算机系教授Percy Liang

斯坦福大学计算机系助理教授、斯坦福人工智能实验室成员 Percy Liang 主要研究方向为自然语言处理(对话系统,语义分析等方向)及机器学习理论,他与他的学生...

850
来自专栏大数据文摘

微软研究院芮勇谈计算视觉:从感知到认知的长征

1181
来自专栏程序员互动联盟

程序员必备的三大核心竞争力

任何职业都有其内在的底蕴,作为一个程序员需要具备的几个竞争力是啥,如何让自己做一个不过时并且一直保持市场竞争力的程序员,特别是一些入行还不是很长时间的程序员是要...

34313
来自专栏量子位

调参的手艺也该失传了:看各路AI专家怎样教AI设计AI

来源 | MIT科技评论 编译 | 量子位 李林 随着人工智能领域的进步,有些人开始担心机器会从人类手中抢走卡车司机等类型的工作。现在,顶尖的科研人员发现,他...

1926
来自专栏机器之心

「凡是过往,皆为序章。」64岁的RODNEY BROOKS谈人工智能的起源与发展

1165
来自专栏韩伟的专栏

机器学习能在游戏开发中做什么

机器学习很容易让人联想到在游戏中的角色 AI 。一直以来游戏中 NPC 或怪物的 AI 问题都是一个游戏比较难解决的问题。比如游戏的角色行为过于单一,让玩家乏味...

9590
来自专栏专知

赶超摩尔定律,NIPS2018提交论文达到8000篇!AI论文价值何在?

3775
来自专栏服务端技术杂谈

技术是最简单的

技术是最简单的,最简单的也是技术。有很多事情只有我们经历了明白,有些事情我们可以从别人身上学到,有些则永远学不到。 动画片里的人们以一种预想的方式生活着,这个世...

3295

扫描关注云+社区