中国AI已经落后,深度学习是机遇更是挑战!

发展人工智能,重点是如何突破将来人工智能要解决的基础和关键问题,而不只是低头跟随性地应用深度学习,只有从这点上着手,我们才有可能实现在人工智能领域追赶、超过或引领世界先进水平的目标。

人工智能基础研究中美相差甚远

如今,大多数人存在这样一个认知:中国和世界人工智能差距不是很大。这几年,中国在学术研究方面也取得了很多进展,在重要的国际会议、期刊杂志上,中国相关研究机构和人员发表的论文也占了相当的比重。中国有数量庞大的网民,在网络数据上占有优势地位,而且中国市场需求巨大,所以最后的结论是:中国赶超世界人工智能的最高水平,可以做到,也必须做到。

我认为这种观点“不完全对”。首先,“中国在人工智能领域的研究、开发、产业水平跟世界相差不大”这句话不完全对。在基础、算法的研究上,中国和世界顶尖水平还相差甚远,这是不争的事实。人工智能在1956年诞生的时候,是美国人建立的学科,这61年中,一直是美国在引领人工智能领域的发展,如今依然是美国和加拿大等北美国家在引领这个领域的发展,他们不断地创新,如果我们不重视基础/算法理论研究,不在这些领域赶上他们,会非常制约中国的创新能力,特别是原始创新的能力,要赶上或超过世界先进水平有困难。

深度学习拓展了AI的技术边界

深度学习的提出,在人工智能领域中是一个重大突破。以往人工智能只能用来解决人们非常了解,而且能够清楚地表达出来的问题,例如医疗诊断、下象棋等。,但这些问题涉及的领域非常有限,深度学习拓展了人工智能所能解决问题的边界。

其次,深度学习具有一定的通用性。比如,人们用深度学习做图像识别,不一定要具备非常丰富、专业的图像知识,即使你不是这个领域的专家,也能把深度学习应用到这个领域。因此,深度学习是一种大众化的工具,它大大延展了解决问题的领域。

对大众而言,深度学习创造的一些奇迹让人们认识到了它的威力,其中,震动最大是Alpha Go。在下围棋等方面,以往都被认为是人类最擅长的,居然也被机器超越了,所以人们觉得惊讶、震动。

深度学习成功的三大法宝

关于深度学习,人们现在更多地关注两个问题:一是这些奇迹会不会在今后不断地发生,二是如何推动深度学习继续向前发展。

我认为深度学习有三大法宝:一是数据,二是计算资源,三是算法。大家对于前面两个方面比较注意、有体会,很多人还没有体会到算法的重要性。这里继续以Alpha Go为例,具体谈谈它如何使用这三个法宝。

Alpha Go战胜人类棋手,跟象棋的人机大战完全不一样。象棋程序的做法就是把象棋大师的下棋经验编成程序放在机器里,所以做象棋程序的人相当一部分是象棋大师,而且请了好多象棋大师帮忙,深蓝打败卡斯帕罗夫,其实不是机器打败卡斯帕罗夫,而是大师的群体打败了他,也就是说人们利用机器把一群大师群体的智慧和经验总结起来,才打败了个别的大师。但是围棋不同,围棋程序的开发者里,懂围棋的很少,最高的是围棋业余五段,做出来的东西居然能打败世界冠军,靠的是什么?就是刚才说的三大法宝。

机器用了两个多星期的时间,学了7千万局棋局,这7千万局棋局就是历史以来大师们下过的所有棋局。机器自己又跟自己下,跟李世石下之前也下了千万局的棋局。也就是说Alpha Go比所有的棋手多下了几千万局的棋,最终以4比1战胜李世石。最好的棋手一生中所下的棋局是百万级,而Alpha Go下过的棋局是几十亿级的,这两项数据非常不对称,人类必输无疑。这个例子里可以清楚地看到的是数据的力量和计算资源的力量,看不到背后算法的力量。但Alpha Go能够在两三周里学到几千万个棋局,靠的其实就是学习算法,它自己跟自己下棋,靠的是强化学习算法,没有这些,它是做不到的。

满足四个条件机器才能超过人类

是不是所有问题,只要有数据,就能够做到这么好呢?不是!这要受四个条件限制:第一是需要大量的数据,第二是完全信息,第三是确定性,第四是单领域和单任务,只有这四个限定条件达成后才有可能达到或者超过人类水平。很多问题同时符合这些条件,比如医疗领域中某些疾病的诊断、医疗图像的识别、医学图像识别等,只要符合这四个条件,经过努力,依靠那三大法宝是可以达到或者超过人类的水平。但是,大量的工作并不同时符合以上四个条件,不符合这四个条件中的任何一个,现在的人工智能技术就有困难。

目前来看,相当一部分问题不符合前文所述四个条件。以无人驾驶为例,到现在为止,无人驾驶车辆在特定的条件下可以使用,但是如果在交通非常繁忙的地方,美国、德国都规定此时司机不能下车,无人驾驶车辆上必须有司机,这是目前人工智能的缺陷。

原因很简单,复杂路况下,计算机无法处理大量的多任务的信息,“中国式过马路”计算机无法判断,因为突发事件、新的场景、新的路况层出不穷,计算机不可能把所有情况都算到。但是人为什么可以,机器为什么不可以?理由非常简单,就是人工智能现在做不到举一反三,人工智能现在只能够达到是举一百反一,学习过的东西才能够识别,没学过的识别不了。

因此,关于机器学习的下一步发展,现在有两个问题。一是多任务问题怎么解决。不久前Google发表了一篇让人震惊的文章,一个模型可以学习所有的任务,这也就意味着在一个网络里,一个模型里可以学多项任务。一共学了8项任务,这8项任务中有5项属于机器翻译,另外有图像识别、图像解释等。如果这个问题解决了,就能让计算机解决更复杂的问题,因为这不仅涉及到一个领域,还涉及到另外的领域。虽然这只是个初步工作,但是它代表了一个非常好的趋势。

二是样本少了怎么办。现在有自动产生样本的方式,这一点也是美国研究人员提出的方案。两个对抗的深度网络就可以产生各种各样的样本。现在可以逐步地自动产生非常复杂的环境和路况,这就可以解决样本不足的问题。因为有大量的现实问题根本没法取样。

深度学习并非万能

回头来看,深度学习也不是非常完美的。很多人以为用深度学习去做产业或者应用不会有问题,但是需要注意的是,深度学习有大量的隐患,这些隐患在很多应用场合下是绝对不允许的。第一,深度学习需要大量的样本,有些问题很难获取很多样本,比如特殊疾病,罕见疾病;第二,推广能力差,训练什么就只能学到什么;第三,不可理解性,现在深度学习建立的系统,实际上跟人的思维方式很不一样。

因此,只有在非常特定的环境下才能说机器的识别能力超过了人,其他很多方面机器不如人。比如用一张图告诉机器这里有一只猫,这个猫在这张图的信息流里只占了1.1%的比重,也就是说提供的样本对于“识别猫”这项任务来说只有1%的信息有用。提供这张照片告诉机器这是一只猫,机器根本不知道猫在哪里,这就迫使人们必须使用大量的样本告诉它这是猫,用各式各样的样本在不同背景下的猫去训练它,它才能认识。只有跟它相近的背景、相近的角度拍下的猫它才认识,如果背景变了,猫拍摄的角度变了,它就不认识了。这是一个根本性的问题,机器不理解,但人识别猫是基于对猫的理解。

过去研究的重点放在机器如何理解人上面,比如说人类的语音命令,用自然语言发的命令机器能够听懂,这是自然语言对话。其实以前的研究忽视了非常重要的另外一点,那就是人如何理解机器。这个角度由深度学习引起的,因为有了深度学习以后,机器做出来的事情人非常不理解,这就给人机共同合作带来了巨大的困难,因此现在除了做自然语言理解、理解用户意图等这些工作外,在人如何理解机器方面也要深入研究。

目前,关于深度学习的研究不仅只是大学或者科研机构在发力,企业也都在纷纷参与。发展人工智能,重点是如何突破将来人工智能要解决的基础和关键问题,而不只是低头跟随性地应用深度学习,只有从这点上着手,我们才有可能实现在人工智能领域追赶、超过或引领世界先进水平的目标。

本文来自企鹅号 - 大数据周刊媒体

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

苹果Face ID不只是人脸识别,更重要的是那层深度信息

AI科技评论按:昨晚凌晨一点,号称是科技界春晚的苹果发布会如期而至,此次共发布了3款iPhone手机,命名也与之前曝光的信息相符,分别为iPhone X、iPh...

2865
来自专栏AI科技评论

Yann LeCun专访:我不觉得自己有天分,但是我一直往聪明人堆里钻

AI 科技评论按:纽约大学教授、Facebook 副总裁与首席 AI 科学家 Yann LeCun 由于对深度学习的突出贡献,被誉为深度学习的「三驾马车」之一,...

872
来自专栏AI科技大本营的专栏

机器学习依然奇货可居,但不是只有博士才能玩得转

【AI100 导读】AI100 正在播出 Jeremy Howard 教授讲授的 Fast.ai 课程。最近,Fast.ai 的另一位创始人 Rachel Th...

3625
来自专栏AI科技大本营的专栏

苹果上线机器学习博客,背后隐藏着怎样的动作和野心?

作者 | 周翔 本周三(7 月 19 日),一个名为“Apple Machine Learning Journal”的博客在苹果官网悄悄上线,一同发布的还有一篇...

3217
来自专栏AI科技评论

2019 互联网校招薪酬曝光,看你能拿到多少钱!

AI科技评论按,2019 年秋季校园招聘已进入尾声。近年来,校招成为了企业争夺人才的主要阵地,尤其是互联网行业,很多企业都会用高薪来吸引优秀的人才。最近,网上曝...

862
来自专栏量子位

伯克利教授说人机共存才是未来;李飞飞说简直再同意不过

陈桦 编译自 WSJ 作者 Ken Goldberg 量子位 报道 | 公众号 QbitAI 今天,加州大学伯克利分校工程教授、“人类与机器人行动”主任Ken ...

3627
来自专栏新智元

中国常春藤联盟院校都参与,腾讯广告算法大赛30万大奖出炉!

【新智元导读】7月30日,2018腾讯广告算法大赛决赛结果出炉:来自吉林大学、哈工大和北邮同学组建的“葛文强”队夺得大赛冠军,赢得30万元奖金!这次大赛赛题是L...

723
来自专栏新智元

【2018将成为AGI元年】13名专家盘点2017最重要AI事件,预测AGI将取代AI

来源:kdnuggets.com 作者:Matthew Mayo 编译:刘小芹 常佩琦 闻菲 【新智元导读】2017年人工智能最重要的发展是什么,2018年...

3345
来自专栏新智元

概率计算或成AI突破新爆点,最适合处理不确定性

1205
来自专栏Crossin的编程教室

廖雪峰大神13个案例带你全面入门人工智能!

现在互联网上广为流传的[18届互联网校招薪酬表],震惊了还在敲代码的小编我,给你们看看这张高薪表 ??

855

扫码关注云+社区