伦敦大学皇家霍洛威学院计算机系教授骆志远做机器人学习的主题演讲

骆志远:谢谢李老师的介绍,也很高兴来到美丽的杭州,有机会与大家一起交流讨论人工智能。抱歉,我的PPT都是英文的,但是我会用中文演讲。

刚才李老师介绍了我今天主要讲“机器人学习”方面的内容。我会先介绍机器人研究所面临的挑战,然后稍微介绍什么是人工智能,大家都听说过AI、机器学习、深度学习,可能媒体报纸会讲到这些名词。我会讲讲什么是人工智能、什么是机器学习、什么是机器人学习等等。现在电视上看到是已经装配好的,但出现特殊情况时怎么办?此时就需要机器人的智能,这就是机器人学习的方向。最后我会介绍机器人学习的未来方向。

现在机器人很火热,可能大家想象的机器人和看到的场景主要是工业界以及装配线上,机器人可以替代工人,做很多繁重的劳动。从过去四十年来讲,中国的机器应用很大。现在机器人走进老百姓的家庭,也有很多服务型机器人,在很多仓库尤其是大型网络运营商的仓库里,有机器人搬运东西,有了订单以后,可以到仓库的特定位置取下包裹或者分拣包裹。

机器人在医疗上也有很大的用处,比如说在英国。有些机器人已经用在医院里,协作外科医生进行手术,有一款美国的手术机器人达芬奇可以和外科医生一起做前列腺手术等等。家庭中也有很多信息机器人,这些机器人不是我们想象中机器人,举个例子,谷歌有个智能语音,放在家里可以进行语音对话从而得到一些信息。根据国际机器人协会估算,到2019年会有100多万新的工业机器人将走进工厂。

刚才提到机器人逐渐走进老百姓的家里,Amazon有一款智能音响叫Echo,你可以问它今天几度、红烧肉的配方等等,软银有一款人形机器人叫Pepper,主要可以和老人进行对话,可以通过对话感知情绪,还可以进行一些生活上的帮助。无人驾驶也是相当热门的研究行业。

今年年初美国《科学杂志》下的子刊《科学机器人》对机器人产业进行了相关调查,咨询了机器行业的专家,让他们想想今后5-10年机器人发展面临的挑战,他们把这份问卷归纳为十个方向,也就是机器人要进一步发展所面临的十大挑战,这十大挑战将对产业形成巨大的影响。

十大挑战分别是:一是新材料制造方案;二是仿真机器人和生物混合机器人;三是能量和能源;四是机器人集群式处理任务,可能一组机器人,像一组无人飞机如何协同完成复杂的任务;五是航行与探索;六是机器人技术的发展;七是脑机接口;八是社会互通,也就是说在某些领域机器人和人类协作互相帮助,完成任务;九是医疗机器人;十是机器人的伦理和安全,这是国外比较热门的话题,现在大家也知道有些人对于人工智能的发展持一定的怀疑态度,还有一些人工智能发展到一定程度,机器人的伦理和安全也非常重要。

人工智能牵涉很多法律问题,比如说无人驾驶,出了事故,在国外,保险公司要认定责任,是车子的问题,是追究软件开发商的问题还是车辆拥有者的问题,到底是谁来负责,这也是一个很热门的研究方向。针对其中的几项挑战,我觉得人工智能会解决相应的问题,比如人机接口、社会互动。

人工智能不是一个很新鲜的东西,也许大家会觉得人工智能很厉害,其实50年代就有提出了人工智能,1956年有一帮学者在美国开会就提出了人工智能的术语。人工智能也经历了很多起伏,80年代人工智能也相当火热,大家也听说过日本推出了五代机的计划,也投向机器像人一样思维。在50年代、80年代机器主要是基于规则的判断,也就是说想把问题的方案用简单的规则归纳出来。比如温度,如果温度高了就把空调打开。对于简单的问题,可以制定规则,但很复杂的工业控制问题,规则很复杂,也很难,把规则写下来需要很多专家来实现。

到了80年代,就出现了机器学习。机器学习的思维是思想,就是能不能从观察的数据当中找回,不要专家写如果怎么样就怎么样,如果告诉专家输入是这样,输出结果是这样,能不能根据结果输出的相关性找出规律,就是数据驱动。

到90年代基本上就这样了,但也遇到了瓶颈。因为90年代的数据量比较小,很难得到很多数据。其次就是计算能力有限,到2006年深度学习异军突起。为什么深度学习异军突起呢?因为十年前左右,计算能力大大提高。现在可以用图形卡、GPU进行计算。第二个关键就是很容易得到数据,现在有多少人在上网,一上网就在为很多大公司提供数据,在国外,用户产生的数据就是很大的数目,有了大量的数据,有了比较好的计算平台,再加上算法上的改进,现在深度学习在某些领域所取得的成绩和人的图像识别、语音识别上,达到的准确率和一般人的水平差不多。

人工智能、机器学习和深度学习是这样的关系:深度学习只是机器学习的一个分支,比如基于逻辑、基于分析或者基于统计数据的分析;机器学习也只是人工智能的一个分支,机器学习和人工智能有很大的关系。

刚才讲了,机器学习是人工智能的一个分支,计算机能不能从过去的经验当中学习提高本身的性能。在什么情况下能用机器学习呢?机器学习并不是灵感妙药,什么情况下都可以使用。机器学习对某一类问题相当有效,什么问题呢?就是无法用数学公式描绘出来的问题。例如人脸识别,要把人脸用一组数学公式描述出来相当困难,还有语音识别。面对这样的问题一定有模式,如果一类问题没有模式,机器学习也不能实现。要机器学习一定要有数据,没有数据,机器学习也帮不了忙。

所以,第一,问题要有模式;第二,问题无法用数学公式表述出来,如果问题可以用数学公式表达出来,就不用机器学习,有公式就可以直接算出来;第三,要有语音识别。

机器学习和常规的编程还是有区别,常规的编程技术是有了数学,把规则讲清楚了,数据加上规则就产生结果。而机器学习,观察输入是什么、输出是什么,希望根据输入、输出找出相关性,得到一组程序。机器学习也有不同类型的学习任务,一般来讲有三大类:一种叫监督式学习,第二类是无监督式学习,第三类是强化学习或者增强学习。

监督学习是最常见的机器学习方式,刚才说机器学习有输入和输出,监督学习是每个输入都有标记,有一幅图像告诉它是猫还是狗,“猫”和“狗”就是标记。监督学习第一类是分类,第二类是回归,如果我告诉你杭州下沙一栋房子的面积是多少,可以根据这个计算出房子的价值,这就是回归。监督式学习占机器学习的80%左右。

第二类是无监督学习,在无监督学习当中没有标记,就是给你一幅图像,只是告诉你图像是猫还是狗,在这种情况下是采用聚类的方法,聚类的方法就是要把数据分为一组集合,集合的对象是同级别的对象彼此相似,但与其他集合中的对象相异。

另外一种无监督学习的方法就是降维,有时候要数据可视化,那只能放在两维或者三维当中,怎么把高维的数据投入到低维看结果。

第三类是最近比较热门的强化学习。强化学习的思想是50年代、60年有已经有了,只是最近比较热门。它是从动物学习过程过来,就是在这种情况下没有标记,自体在环境当中,和环境互动。在环境当中不断的试错,一开始也不知道怎么处理,像我们到了一个陌生的地方,比如我从这里到西湖,如果是第一次到杭州不知道怎么走,但可以试一试,从这里走不行,下一次就不会走老路,这就是强化学习和环境互动。互动过程中会得到反馈,环境会告诉你是成功还是不成功,有奖励还是有惩罚,像下国际象棋通常就可以用强化学习。就像我们学象棋也是这样,不知道什么是好棋什么是臭棋,多下几次之后就知道好的策略,就知道在什么情况下走什么子。

前几年英国有个公司叫DeepMind,它研究的Alpha Go击败了李世石,他们用的方法就是强化学习,让算法不断的学习,它的学习是互弈,在下棋的过程中逐渐摸索,找到一个好的策,这是现在比较热门的(领域)。它在下棋和机器人上应用得也比较多,就是怎么让机器人找到一个好的策略,最好的方法就是试错,根据环境的互动发现好的策略。

机器学习也有不同的流派,美国的教授佩德罗·多明戈写了一本书叫《终极算法》,这本书当中把机器学习分为五大类,就像武工一样有不同的流派。第一个学派是根据逻辑运算,他认为逻辑推理是通往知识的唯一路径;第二个学派是连接学派,研究人大脑如何怎么思维,神经网络、深度学习都属于这个流派;第三个学派是贝叶斯学派,贝叶斯告诉我们如果观察到新的世界,怎么更新判断;第四个学派是进化学派,最有名的是基因算法,把问题表达成像一组基因,基因可以直接进行混合,根据不同的混合方法产生新的结果;第五个学派是类推,就是像什么就是什么。

《终极算法》这本书希望把五种算法综合起来,根据各个算法的优点综合起来找到一种终极算法,这种终极算法就可以获得过去、现在和将来的所有知识。

刚才讲了深度学习是机器学习的一个分支,为什么最近深度学习那么热门,因为机器学习就需要数据,数据往往无法直接进入机器学习,有了数据要进行预处理,有了预处理之后还要找到特征,选取特征,最后用机器学习的算法进行预测和分类等等。从前面的预处理到特征抽取、特征选择是很繁琐的过程,过程好坏会直接影响机器学习的结果。

学过计算机就知道,不管什么程序,垃圾进去就是垃圾出来,同样机器学习也是一样,如果数据质量不高也不能得到很好的结果。所以,在机器学习里,80%的时间就用于抽取特征、特征选择,非常繁琐,需要专家支持,而且这是一个手工过程,很难自动化。

近年来,深度学习的崛起就取决于它可以把这些过程过滤掉,现在可以做到端到端,也就是可以把得到的数据直接放在深度学习的算法当中,让深度学习自己做特征抽取,然后做特征选择。因为刚才讲了深度学习是基于人脑的研究,因为人脑处理信息是一层一层的,从简单的逐渐把它抽象起来,到复杂。为什么深度学习叫深度呢?因为它有很多层,每一层会根据下一层得到数据,进一步抽象,进一步处理,逐层上去。

刚才讲了常规的机器学习要人工进行特征抽取,最后进行分类等等。现在深度学习可以让数据直接进来,让深度学习的算法进行抽取和计算。

这里做个小广告,我们的机器学习领域相当强,主要研究机器学习的算法,这类算法是保型计算。很多机器学习只是告诉结果,只是告诉你明天要下雨,要不要带伞还是不带伞,如果明天下雨的可能是90%,肯定要带伞,如果明天下雨的可能性只有10%,可以不用带伞。所以我们的研究是不仅告诉你运算,而使运算结果得到保证,这是我们的研究方向。

现在报告的主题叫机器人学习。机器人学要解决的核心问题就是让机器人自己学会执行各种决策控制。有些任务对于我们来讲很简单,比如叠衣服,但让机器人叠衣服,这个过程还是有相当大的挑战性。因为对这类问题,更多的是需要对机器人进行底层的连续控制,而不是最高层的决策。例如叠衣服,要分解为一系列的底层决策问题及控制。

怎么实现这些任务呢?机器人学习还是相当困难的,因为有一系列的问题,机器人身上会有很多传感器,但这些传感器也不是100%的准确,还需要实时响应,还要进行在线学习,训练的时间也十分有限。这样的话,我们能不能用机器学习的方法针对这些挑战,形成新的改进方式。有些问题要把以往学习的东西用到另一个东西上。我们可以用到一些新的知识,我们也可以把其他领域学到的知识用到现有的领域当中,这叫迁移学习,看看能不能把以往的知识综合起来。

对于机器人来讲,它需要做一些工作:一是需要学习,怎么获取知识;二是怎么进行规划,比如要从A点到B点,该怎么走,这是路径规划;三是控制,从A点到B点应该怎么操作;四是要能适应新的环境。这四个方向是机器人研究所要面临的方向。就是怎么学习、怎么获取知识、怎么规划、怎么控制,最后是怎么适应新的环境。

现在用得比较多的是模仿学习,模仿学习可以通过在某种意义上模仿人类行为,给机器人关于世界的先进消息。就像小孩子一样,教他骑自行车第一步应该做什么,第二步做什么,这叫“模仿学习”。我们能不能利用传统的控制算法,结合深度学习,实现机器人端到端的控制,这也是另一个方向。

最后,稍微讲一下机器人的未来。

第一,我们希望以后机器人可以到达任列无法到达的地方,例如深海、太空或者到灾难区进行探索,因为这些地方没有地图,而且通常这些地区极为混乱,危机四伏,机器人学习可以对这类问题有所帮助。

第二,是一开始讲到的机器人会逐步进入人类的生活,因此要学会和人类打交道,比如和人一起工作。以前也讲了医疗机器人,这些机器人可以做一些手术流程过程中比较常规的步骤,让外科医生为病情较为复杂的病人服务。

第三,农业机器人也会在广阔的田野上越来越的代替人工完成各种农活,降低农民的劳动力,从而促进现代农业的发展。也可以从不同土壤的实际情况出发进行施肥,不仅可以降低成本,也可以减少污染,让地下水质得到改善。

第四,机器人也可以用在智能能源和低碳当中,机器人可以进行维护、维修,在风力发电的场所或者是水利上,它可以进行全生命周期管理,可以依赖互联网、大数据进行全天候的管理,智能控制和维护。

谢谢大家!

浙江国际协同创新研究院成立于2017年6月,总部位于杭州,是经浙江大学学术委员会主任张泽院士与副主任谭建荣院士共同倡议(张泽院士任研究院理事长、谭建荣院士任研究院院长),在浙江省委省政府车俊书记等有关领导关心支持下,由浙江省院士专家工作站服务中心、杭州市高科技投资有限公司、浙江北大协同创新投资管理有限公司共同发起成立的民办非企业新型科技成果产业化服务机构,是“院士专家团队+行业龙头企业+专业投资机构”有机组合的未来产业创新服务综合体,致力于构建“研发服务+投资孵化+产业引爆”三位一体的创新体系,努力推动浙江未来产业发展。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181015F1E6LE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券