学界 | 专访北京大学王立威教授:高校算法的突破与创新要走在数据前面

AI科技评论按:中国人工智能学会AIDL第二期【人工智能前沿讲习班】日前在北京中科院自动化所举行,本期讲习班的主题为【机器学习前沿】。北京大学教授王立威带来了题为《机器学习理论:回顾与展望》的主题报告,主要对机器学习中关于泛化能力的几个重要理论进行介绍。

北京大学教授王立威博士的主要研究领域集中于机器学习,在包括COLT, NIPS,JMLR, PAMI等权威会议期刊发表论文60余篇。2010年入选AI’s 10 to Watch,是首位获得该奖项的亚洲学者。2012年获得首届国家自然科学基金优秀青年基金,新世纪优秀人才。任NIPS等权威会议Area Chair,和多家学术期刊编委。在主题报告结束后,AI科技评论与王教授做了短时间交流。

1. 您曾经指出,机器学习理论在于理解人工智能的局限性。结合您的研究经历,您认为人工智能现在能做什么?还不能做什么?可能的突破口又在哪里?

我觉得在过去几年,人工智能或者机器学习的发展已经把这个问题很好地展现了。现在做得很好的两个领域主要集中于图像和语音,由于深度神经网络的结构利用了先验知识,自然也非常适用于这两个领域。

当然,产业现在也发展得比较好,所以我认为未来短期内如果会有重大突破的话,更多的是在应用领域,找到和图像和语音相关的比较好的结合点,可能不是偏学术领域,而会是一个是偏商业化的方向。(AI科技评论:更好地产品化。)对,找到一个更好的应用。

2. 目前工业界开始出现与高校合作的趋势,前者提供数据和研发资金,后者提供研发支持,而往往这些研究都是应用导向的。您认为这样的合作会对理论研究产生怎样的影响?

我想举这么一个例子,就是产生很大影响的 AlphaGo。从最终展示出来的成果来看,我们可以认为,AlphaGo 是一个非常成熟的应用系统。而 Alpha Go 从最开始的想法到技术落地,同样很大地推动了学术的前进。比如 DeepMind,不论是从算法和理论上都有突破,这一点研究界也有目共睹。(工业界研究推动学术发展)同样也是很好的一个模式,我认为,将来工业界和高校的合作趋势也可以取得这样的一个成功。

3.现在云计算已经将计算力提升到一个以前不敢想象的高度,甚至已经远远高于样本的获取能力。那么构建样本会成为未来的研究重点吗?

数据其实是一个很大的问题,也牵扯到很多方面。我的一个考虑是,今天应用的比较成功的领域,包括图像和语音方面,实际上这些是属于非专业知识的数据,随便请一个人,一个普通人,就可以对图像或者语音进行标注。这类问题当然也有应用,但有很多相当一大类数据是属于专业数据,比如说医疗数据,这些只能让医生进行标注,它的成本实际上是很高的。

4. 此前与其它老师交流的时候,他们提及高校研究的数据量不够大的问题。那么从您个人的研究经验来看,数据对于算法而言处于怎样的地位?

我认为主要有两个方面。一种是应用,关注的是系统的最终性能,而数据对后者的影响是巨大的。当然高校是完全无法和企业相提并论的。但高校更重要的一个任务是,我能不能去设计新的更好的算法。我们并不是只停留在 Deep Learning 这样的算法上,就像我在演讲中提到的那样,也许两三年后,Deep Learning 也许就不是最好的,这完全有可能。那么这个新的算法该由谁来提供?我想这应该是高校教师的职责,是他的本职工作,researcher 就应该做这样的事情。所以我提出一个新的算法,未必要等到手里有巨大的数据量才开始做研究。

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-06

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

干货 | 中国运筹学会理事长胡旭东:运筹学与人工智能(80页PDF)

AI 科技评论按:日前,中国科学院数学与系统科学研究院胡旭东研究员在一次内部会议上发表了以《运筹学与人工智能》为题的专题报告。在报告中,他扼要介绍中美两国政府、...

2787
来自专栏新智元

AI、大数据和数据科学的10类算法, 以及它们擅长的任务

【新智元导读】AI正在改变我们的职业、我们的工作方式和我们的企业文化。AI让我们得以专注于那些真正关键的技术,让人力资源得以充分发挥他们的长处。但在工作场景中应...

2806
来自专栏媒矿工厂

人工智能赋能流媒体

前言 人工智能(AI)、深度学习和自然语言处理将成为新一代流媒体行业的关键技术。从生产到消费的各个阶段,它们都将产生非常重大的影响。毫无疑问,随着人工智能在许多...

37310
来自专栏AI科技大本营的专栏

CCAI 2017 | 小数据学习对 AI 究竟有着怎样的影响?

近几年来,得益于大数据的积累、计算能力的提升,深度学习从学术到工程领域均取得了非常显著的发展与突破,尤其是诸如图像识别、语音识别等实际场景应用。但是,依赖于海量...

3215
来自专栏新智元

【微软语音识别新突破,错误率降至5.1%】黄学东:新的行业里程碑

【新智元导读】微软语音识别系统取得最新突破:微软的语音对话研究小组在Switchboard语音识别任务中,将错误率从去年的 5.9% 再一次降低到 5.1%,达...

2755
来自专栏人工智能头条

增强学习是人工智能的未来

1776
来自专栏大数据文摘

Yann LeCun说阿尔法狗在现实世界无法复制,还和MJ、李开复聊了聊AI前景(全程实录+PPT)

1203
来自专栏AI科技大本营的专栏

普林斯顿大学助理教授王梦迪:增强学习是人工智能的未来

近日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办,CSDN、中国科学院自动化研究所承办的 2017 中国人工智能...

38813
来自专栏钱塘大数据

《哈佛商业评论》:人工智能商业之路的机遇和挑战

250多年来,经济增长的根本动力一直是技术创新。其中最重要的是经济学家所谓的通用技术——包括蒸汽机、电力和内燃机。每一个都催化了互补创新和机遇的浪潮。例如,内燃...

35311
来自专栏机器人网

人工智能工程师机器学习知识结构图

尽管机器学习技术看起来这般神器,但是对于机器学习技术的好奇心是一码事儿,而想要让该技术在相关产业当中发挥作用实际上又是另外一码事儿。 如果你正在考...

834

扫描关注云+社区