专栏首页DT数据侠人工智能潮起潮落,方向始终如一 | 数据科学50人·陶大程

人工智能潮起潮落,方向始终如一 | 数据科学50人·陶大程

陶大程,悉尼大学教授、优必选悉尼大学人工智能中心主任、优必选人工智能首席科学家。从本科到博士,从大学教授到欧洲科学院外籍院士、澳洲科学院院士,他一直专注于人工智能的研究,在基于数据发展的机器智能时代里,他与世界上大部分AI学者一样,从学界跨入工业界,投身人工智能的第三次浪潮。在这次“数据科学50人”系列专访的对话中,他用自己的学识与眼界向我们阐述了自己对数据科学与人工智能的观察,希望给予读者思索与启发。

▍赋能——数据科学与人工智能的时代

数据科学、人工智能,当我们把这些粗犷的概念进行逻辑性地叠加时,我们便了解了他们之间的关系。

陶大程教授在解析数据科学时,如此说道:“数据科学是一门利用数据学习知识,并从数据中提取有价值的信息,以分析现实现象、挖掘本质和关系的学科。数据科学是一个对数据理解和分析的交叉学科,除了需要统计学、数据挖掘、机器学习等数据分析、理解和挖掘的学科,还涉及其他学科,包括物理、材料、化学、生物、医学等等。”

逻辑严密是人工智能学者的典型特质,而在国外大学为人师的陶教授也会利用生动的比喻与举例来解释他的观点与想法。“如果我们获取的数据来自一台照相机,并且目标是检测、识别图像数据中特定物体,那么这是机器视觉。机器视觉作为基本工具,获取了图像的基本信息,如何从这些信息中获得更多领域的知识,便是数据科学了。”

(图片说明:陶大程教授发表《AI破晓:机遇与挑战》主题演讲)

目前数据科学正在与基础行业、应用行业相互结合,比如物理、化学、生物以及材料学等。“以天气预报为例,传统的方法是建立物理模型,根据模型回归、解释数据,并进一步预测未来的天气。而使用数据科学的方法就可以完全不同:利用历史数据、专家标注信息,建立统计学习模型就可以达到进一步预测天气的目的,而且有的时候效果更好。”陶教授对数据科学的应用做出了自己的解释。

数据科学,相对于传统解决业务问题的方式与方法,减少了对于传统行业垂直知识的依赖,利用数据解决问题。在陶教授看来,如何通过利用数据科学的工具,从数据处理、分析预测,再到可视化,一步一步赋能产业,解决具体问题、满足实际需求,更是数据科学发挥作用的地方。

(图片说明:人工智能与数据科学的关系)

说回到自己的研究领域——人工智能,陶教授认为,高质量的数据是人工智能的基础,数据质量与完备性直接影响到人工智能解决问题的能力与效果。

从中国科大语音实验室里学习语音合成、信息处理中心(IPC)里学习图像检索的青涩少年,到中国香港中文大学多媒体实验室里做相关反馈的研究生,再到英国伦敦大学研究机器学习算法的博士,以及后来在中国香港理工大学、南洋理工大学、悉尼科技大学和悉尼大学传道授业解惑,陶大程这20年,与人工智能技术为伴,一路走来,方向从未改变。

想要研究人工智能,除了业耕于勤之外,更重要的是对研究目标进行深度认知与理解,有时候可能还要上升到哲学角度,需要更高维度的思考。

▍未来的AI技术是一场大融合

1956年,“人工智能”一词在美国达特茅斯的一场小型学术研讨会上被提出,直至今日,人工智能的历史走过的63年,历经了三起两落,而当下的人工智能正处于第三次浪潮之中。

今天的互联网充斥着对于人工智能的“赞歌”,部分媒体的报道将人工智能长期的担忧变成了人们短期的焦虑。资本市场更是“火上浇油”,让人工智能的热浪席卷全球。

(图片说明:谷歌趋势与百度指数过去八年里,“人工智能”一词在全球与中国的搜索走势)

人工智能虽然成为了从科技界到金融圈,再到街头巷尾的热门话题,但大部分人对于人工智能的理解并不够真实。一方面,大家在看完各种人工智能战胜人类的新闻后,惊叹科技发展的速度,另一方面,担忧下一个被机器取代的会不会是自己。对此,陶大程教授给出了理性的看法。

陶教授认为, AI的第三次浪潮主要是因为现代社会对于人工智能诉求非常大,应用场景非常多,所以带来了很高的期望,叠加产业的投入、政府的支持等因素,人工智能的发展被加速了。

相对于人类感知(Perceiving)、学习(Learning)、推理(Reasoning)、行为(Behaving)的能力,现在的人工智能差得还有些远。“很悲观的讲,目前来说,很难找到一个算法能够在普适条件下全面超越人的水平。”陶教授说。

但在一些垂直、具象的任务中,机器超越了人类。其中最典型的就是AlphaGo击败了韩国天才围棋选手李世石,著名计算机视觉挑战赛Image Net上,冠军队伍使用机器对指定目标的识别准确率超越了人类。

在棋类游戏,以及特定环境下的电子竞技、图像识别等方面,人类都输给了机器,但这并不代表机器拥有了人类的智能,只是解决特定问题的能力超过了人类罢了。陶教授解释说:“目前所说的机器智能,实际上与人类的智能不是一回事儿。目前机器只能在训练和测试数据满足独立同分布的假设条件下才能很好的工作,而人类却不同,因为我们有很强的泛化能力。尽管迁移学习在一定程度上缓解了非独立同分布的问题,但是还有很大的空间需要研究人员去进一步提升。”

与大部分数据科学50人受访专家的观点相似,陶教授认为,当下的人工智能是一种赋能行业、辅助人类解决问题的工具。当问题能够被很清楚地定义出来时,我们就有相当的机会设计出达到甚至超过人类水平的人工智能算法,来解决实际问题,更好地赋能行业。

在过去几轮人工智能的浪潮中,以知识图谱为代表的符号学派支配了人工智能的首次崛起。90年代开始,贝叶斯网络、进化算法、支持向量机等AI技术与方法拔地而起,2006年多伦多大学Geoffrey Hinton教授等人推出深度学习,将深度神经网络技术为代表的联结派推向了AI江湖盟主的宝座上。但十几年过去,无论是学界还是业界,都传来对人工智能未来发展的担忧之声——未来的AI江湖会由哪个门派掌舵呢?

陶教授最近读了一本名为《疑问之书》(The book of why: The new science of cause and effect)的书,是由图灵奖得主、贝叶斯网络之父Judea Pearl所著的因果推断知识读物。书中,作者解释了一个反映认知能力的三层模型(关联、干预、反事实),并系统地介绍了三层模型对因果推论的重要性。在某种程度上,这本书也在触发人工智能学者对于未来AI技术的思索。

(图片说明:《疑问之书》中反映认知能力的三层模型 来源:《疑问之书》)

对于未来,陶教授表示,人工智能的各个学科之间的发展是循序渐进的,有冷有热。陶教授以现在最受关注的深度学习为例,解释道:“深度学习对于获取基本信息来说,是非常有效的,比如从图像中检测特定物体。”但在他眼中,未来会是各类技术,包括因果推理、逻辑推理、专家网络、神经算法等的有机结合,如此更加有效地通过集成式的人工智能技术,减少我们对于数据的直接依赖性。

陶教授举例说,如果有两张图,第一张图有一千个人在拍集体照,第二张图有几百个人在看足球比赛,那么对于人类来说,看了两张图之后,可能第一时间没法知道两张图片上有多少人,但一眼就能看出来这两张图的区别,第一张的语义分析(Semantic Information)是“拍集体照”,第二张是“看足球比赛”。

而计算机可以快速检测出多少人、他们穿什么颜色的衣服,但是要分析出来照片的语义层面的区别,就需要耗费很大的力气(大量数据集与算力)。在深度神经网络中,我们让计算机学习大量拍集体照和比赛的照片,训练出区分两种类型照片的能力,但如果我们可以用推理的方法来完成,就不需要收集特定的大数据了。

(图片说明:逻辑推理的使用在某些场景下可以减少现行深度学习对于大数据的依赖)

▍在澳洲做研究

澳大利亚是发达国家,并且地广人稀,这给她得天独厚的条件发展人工智能,并且这个2400万人口的国家已经成为很多先进无人技术的试验田。

“骑在矿车上的国家”——澳大利亚,最具代表性的AI项目就属悉尼大学与Rio Tinto(全球矿业巨头力拓集团)合作的无人矿场。早在2003年,澳大利亚就由悉尼大学牵头成立国家重点实验室(ARC Centre of Excellence for Autonomous Systems),专门研究无人自主系统,希望此类技术能够解决澳洲地广人稀所带来的问题。如今,这个国家重点实验室已经进一步发展成为澳大利亚野外机器人中心(Australian Centre for Field Robotics)。

“澳大利亚科研体系非常开放,研究人员来自于全世界各地。”陶教授介绍到。

不到40岁,陶大程教授被授予澳大利亚国家级科研奖项——尤里卡(Eureka)奖。不惑之年的他还在2018年当选澳大利亚科学院院士,也是当年唯一入选的华人科学家。

(图片说明:陶大程教授在澳大利亚科学院做报告)

顶着学术光芒的华人科学家陶大程,继续着他的人工智能的研究与实践。

学界的一大痛点在于数据的缺失,于是包括纽约大学的Yann LeCun,斯坦福大学的李飞飞、吴恩达等人工智能领域的著名与专家学者纷纷加入诸如Facebook、谷歌等互联网科技巨头,让自己的基础研究能力与数据资源有机结合。

2016年,陶大程教授开始接触工业界,加入人工智能与服务机器人企业优必选,担任人工智能首席科学家一职,主导研发先进的、具备核心技术竞争力的计算机视觉技术,并希望这些技术能够赋予机器人环境感知及认知的能力。

优必选还与悉尼大学合作,建立了优必选悉尼大学人工智能研究中心,由陶大程教授担任创始主任。2018年,研究中心提出了基于演化算法的GAN(对抗神经网络)框架Evolutionary GAN (E-GAN),提升GAN训练的稳定性、减小模型塌缩问题,并期望得到更好的生成效果。该工作入选《麻省理工科技评论》(MIT Technology Review)Physics arXiv的最佳论文(The Best of the Physics arXiv)。

在谈到中国人工智能的发展时,陶大程教授表示很看好,“从学术会议、比赛等情况来看,中国和海外科研进展几乎是无延迟的,发展速度基本同步,在工业应用层面中国的进展也非常迅速。”随着未来5G技术以及物联网的发展,数据红利会进一步迸发,人工智能的发展前景会更好。

正如大量海外华人科学家一样,陶大程明白全球化的浪潮下,每个国家都有自身的优势。海外发达国家滋生了人工智能技术的基础研究能力,中国庞大的市场与海量数据酝酿了人工智能的最佳实践场。在这场人工智能的浪潮中,坚守科研的学者们正在推波助澜。

陶大程坦言,自己除了在学校的科研工作外,没太多时间,想要平衡好学界与工业界的双重角色也并不轻松。他身在这波巨浪之中,扮演着不一样的角色,也许更能理性看待一切,虽潮起潮落,唯大方向始终如一。

作者 | Harry Wu wuhao@dtcj.com

题图 | 站酷海洛

本文分享自微信公众号 - DT数据侠(DTdatahero),作者:Harry Wu

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-03-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • AI新基建如何构建?浪潮给出了一个答案

    伴随生产力升级,社会基础设施也正在发生变化。而智慧时代的新型基础设施,要能够对外提供各种算力服务、数据服务和AI服务。浪潮认为,其核心是计算力的生产中心。

    AI科技大本营
  • 人工智能奋斗史

    你读的新闻可能是人工智能写的,拍的照片可能是人工智能帮你美颜过的,你喜欢的那家餐厅可能是人工智能为你推荐的,你看不懂的单词是人工智能帮你翻译的。还有很多尚未普及...

    人称T客
  • 16625篇论文揭示25年来AI进化规律!深度学习时代行将结束!

    这类算法的工作原理是使用统计数据来发现数据中的模式。事实证明,它在模仿人类技能 (如我们的视觉和听觉能力) 方面非常强大。在一些特殊情况或者是某些有限范围内,它...

    数据派THU
  • 中美:人工智能将形成“双寡头”局面?

    “如果说2017年是人工智能在中国引起骚动的一年,那么2018年将成为中国在人工智能领域竞争地位越来越明显的一年。” 比如,人工智能迅速成为中国创业公司最热门的...

    机器人网
  • TMD后,下一波超级巨头会出现在什么赛道?答案是……

    中国互联网已有二十年历史。这二十年间,互联网市场格局不断变化,先是三大门户(新浪、网易和搜狐)形成“三座大山”,接着BAT崛起成为“新三座大山”,再接着三小巨头...

    罗超频道
  • 【中国AI谁最强?】100家入围企业公布,霍金弟子Alan Yuille教授共同见证AI Era创新大奖!

    【新智元导读】约翰霍普金斯大学教授、霍金的学生Alan Yuille正式确定成为新智元AI WORLD 2018大会重磅演讲嘉宾,9月20日在北京国家会议中心,...

    新智元
  • 业界 | 探索系统化技术产品,科大讯飞深度布局医疗行业

    机器之心原创 作者:邱陆陆 近日,科大讯飞智慧医疗事业部总经理陶晓东与常务副总经理鹿晓亮接受了媒体采访,回答了关于讯飞部署人工智能 + 医疗的战略意义、相...

    机器之心
  • “机械战警”牵起他与数据科学的缘分 | 数据科学50人·邬学宁

    邬学宁,SAP硅谷创新中心首席数据科学家,长期致力于机器学习与人工智能算法研究与应用。“数据科学核心算法的基础是简洁优美的数学,这是我愿意用一辈子,去追寻的事情...

    DT数据侠
  • 翻车!3个搞物理的和陶哲轩真颠覆了数学常识?网友扒出95年中文教材

    最近,一个数学公式引发了广泛关注。事情是这样的,三位物理学家请教数学天才、菲尔兹奖得主陶哲轩一个偶然发现的公式。陶哲轩的第一反应是不太可能:这么短、这么简单的东...

    新智元

扫码关注云+社区

领取腾讯云代金券