前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >中国AI已经落后,深度学习是机遇更是挑战!

中国AI已经落后,深度学习是机遇更是挑战!

作者头像
企鹅号小编
发布2017-12-27 15:16:25
1.1K0
发布2017-12-27 15:16:25
举报
文章被收录于专栏:人工智能人工智能

发展人工智能,重点是如何突破将来人工智能要解决的基础和关键问题,而不只是低头跟随性地应用深度学习,只有从这点上着手,我们才有可能实现在人工智能领域追赶、超过或引领世界先进水平的目标。

人工智能基础研究中美相差甚远

如今,大多数人存在这样一个认知:中国和世界人工智能差距不是很大。这几年,中国在学术研究方面也取得了很多进展,在重要的国际会议、期刊杂志上,中国相关研究机构和人员发表的论文也占了相当的比重。中国有数量庞大的网民,在网络数据上占有优势地位,而且中国市场需求巨大,所以最后的结论是:中国赶超世界人工智能的最高水平,可以做到,也必须做到。

我认为这种观点“不完全对”。首先,“中国在人工智能领域的研究、开发、产业水平跟世界相差不大”这句话不完全对。在基础、算法的研究上,中国和世界顶尖水平还相差甚远,这是不争的事实。人工智能在1956年诞生的时候,是美国人建立的学科,这61年中,一直是美国在引领人工智能领域的发展,如今依然是美国和加拿大等北美国家在引领这个领域的发展,他们不断地创新,如果我们不重视基础/算法理论研究,不在这些领域赶上他们,会非常制约中国的创新能力,特别是原始创新的能力,要赶上或超过世界先进水平有困难。

深度学习拓展了AI的技术边界

深度学习的提出,在人工智能领域中是一个重大突破。以往人工智能只能用来解决人们非常了解,而且能够清楚地表达出来的问题,例如医疗诊断、下象棋等。,但这些问题涉及的领域非常有限,深度学习拓展了人工智能所能解决问题的边界。

其次,深度学习具有一定的通用性。比如,人们用深度学习做图像识别,不一定要具备非常丰富、专业的图像知识,即使你不是这个领域的专家,也能把深度学习应用到这个领域。因此,深度学习是一种大众化的工具,它大大延展了解决问题的领域。

对大众而言,深度学习创造的一些奇迹让人们认识到了它的威力,其中,震动最大是Alpha Go。在下围棋等方面,以往都被认为是人类最擅长的,居然也被机器超越了,所以人们觉得惊讶、震动。

深度学习成功的三大法宝

关于深度学习,人们现在更多地关注两个问题:一是这些奇迹会不会在今后不断地发生,二是如何推动深度学习继续向前发展。

我认为深度学习有三大法宝:一是数据,二是计算资源,三是算法。大家对于前面两个方面比较注意、有体会,很多人还没有体会到算法的重要性。这里继续以Alpha Go为例,具体谈谈它如何使用这三个法宝。

Alpha Go战胜人类棋手,跟象棋的人机大战完全不一样。象棋程序的做法就是把象棋大师的下棋经验编成程序放在机器里,所以做象棋程序的人相当一部分是象棋大师,而且请了好多象棋大师帮忙,深蓝打败卡斯帕罗夫,其实不是机器打败卡斯帕罗夫,而是大师的群体打败了他,也就是说人们利用机器把一群大师群体的智慧和经验总结起来,才打败了个别的大师。但是围棋不同,围棋程序的开发者里,懂围棋的很少,最高的是围棋业余五段,做出来的东西居然能打败世界冠军,靠的是什么?就是刚才说的三大法宝。

机器用了两个多星期的时间,学了7千万局棋局,这7千万局棋局就是历史以来大师们下过的所有棋局。机器自己又跟自己下,跟李世石下之前也下了千万局的棋局。也就是说Alpha Go比所有的棋手多下了几千万局的棋,最终以4比1战胜李世石。最好的棋手一生中所下的棋局是百万级,而Alpha Go下过的棋局是几十亿级的,这两项数据非常不对称,人类必输无疑。这个例子里可以清楚地看到的是数据的力量和计算资源的力量,看不到背后算法的力量。但Alpha Go能够在两三周里学到几千万个棋局,靠的其实就是学习算法,它自己跟自己下棋,靠的是强化学习算法,没有这些,它是做不到的。

满足四个条件机器才能超过人类

是不是所有问题,只要有数据,就能够做到这么好呢?不是!这要受四个条件限制:第一是需要大量的数据,第二是完全信息,第三是确定性,第四是单领域和单任务,只有这四个限定条件达成后才有可能达到或者超过人类水平。很多问题同时符合这些条件,比如医疗领域中某些疾病的诊断、医疗图像的识别、医学图像识别等,只要符合这四个条件,经过努力,依靠那三大法宝是可以达到或者超过人类的水平。但是,大量的工作并不同时符合以上四个条件,不符合这四个条件中的任何一个,现在的人工智能技术就有困难。

目前来看,相当一部分问题不符合前文所述四个条件。以无人驾驶为例,到现在为止,无人驾驶车辆在特定的条件下可以使用,但是如果在交通非常繁忙的地方,美国、德国都规定此时司机不能下车,无人驾驶车辆上必须有司机,这是目前人工智能的缺陷。

原因很简单,复杂路况下,计算机无法处理大量的多任务的信息,“中国式过马路”计算机无法判断,因为突发事件、新的场景、新的路况层出不穷,计算机不可能把所有情况都算到。但是人为什么可以,机器为什么不可以?理由非常简单,就是人工智能现在做不到举一反三,人工智能现在只能够达到是举一百反一,学习过的东西才能够识别,没学过的识别不了。

因此,关于机器学习的下一步发展,现在有两个问题。一是多任务问题怎么解决。不久前Google发表了一篇让人震惊的文章,一个模型可以学习所有的任务,这也就意味着在一个网络里,一个模型里可以学多项任务。一共学了8项任务,这8项任务中有5项属于机器翻译,另外有图像识别、图像解释等。如果这个问题解决了,就能让计算机解决更复杂的问题,因为这不仅涉及到一个领域,还涉及到另外的领域。虽然这只是个初步工作,但是它代表了一个非常好的趋势。

二是样本少了怎么办。现在有自动产生样本的方式,这一点也是美国研究人员提出的方案。两个对抗的深度网络就可以产生各种各样的样本。现在可以逐步地自动产生非常复杂的环境和路况,这就可以解决样本不足的问题。因为有大量的现实问题根本没法取样。

深度学习并非万能

回头来看,深度学习也不是非常完美的。很多人以为用深度学习去做产业或者应用不会有问题,但是需要注意的是,深度学习有大量的隐患,这些隐患在很多应用场合下是绝对不允许的。第一,深度学习需要大量的样本,有些问题很难获取很多样本,比如特殊疾病,罕见疾病;第二,推广能力差,训练什么就只能学到什么;第三,不可理解性,现在深度学习建立的系统,实际上跟人的思维方式很不一样。

因此,只有在非常特定的环境下才能说机器的识别能力超过了人,其他很多方面机器不如人。比如用一张图告诉机器这里有一只猫,这个猫在这张图的信息流里只占了1.1%的比重,也就是说提供的样本对于“识别猫”这项任务来说只有1%的信息有用。提供这张照片告诉机器这是一只猫,机器根本不知道猫在哪里,这就迫使人们必须使用大量的样本告诉它这是猫,用各式各样的样本在不同背景下的猫去训练它,它才能认识。只有跟它相近的背景、相近的角度拍下的猫它才认识,如果背景变了,猫拍摄的角度变了,它就不认识了。这是一个根本性的问题,机器不理解,但人识别猫是基于对猫的理解。

过去研究的重点放在机器如何理解人上面,比如说人类的语音命令,用自然语言发的命令机器能够听懂,这是自然语言对话。其实以前的研究忽视了非常重要的另外一点,那就是人如何理解机器。这个角度由深度学习引起的,因为有了深度学习以后,机器做出来的事情人非常不理解,这就给人机共同合作带来了巨大的困难,因此现在除了做自然语言理解、理解用户意图等这些工作外,在人如何理解机器方面也要深入研究。

目前,关于深度学习的研究不仅只是大学或者科研机构在发力,企业也都在纷纷参与。发展人工智能,重点是如何突破将来人工智能要解决的基础和关键问题,而不只是低头跟随性地应用深度学习,只有从这点上着手,我们才有可能实现在人工智能领域追赶、超过或引领世界先进水平的目标。

本文来自企鹅号 - 大数据周刊媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文来自企鹅号 - 大数据周刊媒体

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
机器翻译
机器翻译(Tencent Machine Translation,TMT)结合了神经机器翻译和统计机器翻译的优点,从大规模双语语料库自动学习翻译知识,实现从源语言文本到目标语言文本的自动翻译,目前可支持十余种语言的互译。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档