AI 科技评论按:12 月 13 日,谷歌开发者大会 2017 在上海召开,多名谷歌工程师和重量级嘉宾登台演讲,宣布了许多振奋人心的消息,美国工程师的中文演讲也让现场听众觉得亲切有趣。
最令广大 AI 研究和从业者感兴趣的,是谷歌云首席科学家李飞飞宣布谷歌 AI 中国中心在北京成立,并且也正是由李飞飞和她曾经的博士生、现在的谷歌云研发负责人李佳共同领导谷歌 AI 中国中心的工作。谷歌云 AI、谷歌大脑以及谷歌的中国本土团队的工作也将由李飞飞统筹。
在李飞飞的主会场演讲结束后,李飞飞和李佳来到分会场,和受邀请参与面对面沟通活动的学生、教授、AI 从业人员以及媒体进行了更多沟通和交流。
李佳也在现场进行了一个小演讲,介绍了她带领的谷歌云研发团队近期的一些研发思路和技术产品。AI 科技评论也有记者在现场参与活动,我们把演讲的主要内容整理如下。
李佳:很高兴在这里见到大家,我叫李佳。我是谷歌云 AI 的研发主管,自己也是一个开发者,今天想在这里分享一下 AI 研究的一些心得和谷歌云团队研发的 AI 的一些应用。
在过去的几天里我花了很多的时间练习用中文说话。这是我第一次用中文演讲,如果有很多的英文或者是说英文的单词,请大家谅解。我一度曾经想放弃,想用英文来讲,但是今天看到有这么多的我们外国的友人,在很拼命的用中文来讲,我感到非常的惭愧。练习到昨天我还发觉,大概我的演讲里面大概 70% 的部分还是英文的单词,但是我希望今天能做的更好一点。
今天我想讲这个的原因是,作为一个开发者,我自己觉得很幸运,可以参与一个想法到成为一个完成产品的过程,所以我今天在这里想给大家分享这样的一个历程。希望有更多的人投身到这样过程当中,能够促成 AI 产品的产生。我把这个过程叫做 AI Journey(AI 历程)。
它有几个主要的组成部分。
这个 AI 的历程通常是从最初的问题定义开始,比如图像分类识别。如果想从这个图里面识别出有个毛线团,这个问题的表达形式有很多种,它的解决方案也有各种各样的。
从 ImageNet 数据集发布以后,很多的研究者在它上面去运行他们的算法,很大推动了这个领域的发展。最近我们自己在上面也有一些小的尝试。
可能在座的同学们、老师们,你们有一些人可能听说过 Neural Architecture Search(神经网络结构搜索),这个就是我们最早的一些尝试。开始是由我们研究的一个算法,最近我们谷歌云和谷歌的其他的一些团队,也在这上面做了一些新的尝试。这个是什么样的算法呢?它会尝试搜索、组合不同的基础网络结构,形成一个完整的网络。它的最终目的,是想让机器自动生成神经网络。图中是一个例子,我们怎么样生成在 ImageNet 和 CIFAR 上有良好表现的神经网络。
现在在我们最新的尝试里面,这种机器生成的算法已经是顶级的了。但我想提醒大家的是,虽然这是一个很激动人心的技术发展成果,但是,目前这种机器生成的模型只局限于某一个特定的问题,是端到端的一种解决方案。但是在现实生活中,或者对于现实当中的问题,会涉及到许许多多不同技术的共同应用。在这个例子里面,数据都是收集好的,但是在很多的情况里面我们是没有办法收集数据的,比如说罕见的疾病,还有自然灾害当中发生的问题,很多的数据是非常难以收集的,或者是收集起来非常危险的。
这里就有一个例子,在自动驾驶技术中我们根本没有办法去训练算法如何应对交通事故,或者比较罕见遇到的交通情况,因为没有这样的数据。这种情况是否能有替代做法呢?我想提下这个模拟器的技术。这样我们可以自由生成各种各样的数据,来表现这些复杂的情况。
另外一个有名的例子就是 AlphaGo 和很多很多的棋牌游戏,当我们对游戏的规则非常明确了之后,就可以让算法自己生成许多数据,然后从生成的数据中学习。
这个技术经常被用在迁移学习里面,我们可能在原有领域有很多数据,但很难在新的领域收集同样多的数据;这是其中一个问题。还有很多其它问题,比如说我们在谷歌云上面遇到的很多问题,它们通常是没有已知的解决办法的,它们也没有办法找到这样大量的数据。
我们这里要解决的是一个小数据的问题,不是大数据的问题。在这个过程中,迁移学习、模拟器技术都是非常值得去研究去探索的,在能够真正的解决实际问题之前,能够达到我们希望的能够处理任何情况之前,先用这样的技术让模型快速成长。
我们同时也能挖掘出一个很大的宝藏,机器人技术。比如说用模拟器的方法解决机器人技术的问题。
我当时和我的同事一起去把 Gazebo 平台的代码收集好,开放给大家来用。我们自己在上面做了一些探索,发现如果我们把大量的问题放在里面,就算不是从直觉上能完美解决好的问题,只要能够把问题和大规模计算、大规模仿真模拟进行结合的话,实际上它还是能得到非常好的效果的。
我刚才谈到一些有关模拟器生成数据的探索,实际上算法也对这个领域至关重要,其中包含了怎么样有效让我们人指导机器来进行学习。当然,让机器学习也还有各种不同的办法。
我刚才谈到了几个比较小的例子,都有什么样的问题是值得我们去解决的。而数据中蕴含的价值很多、数据的来源和用途很广,我们实际需要数据相关技术来解决的问题比刚才我谈到的还要更广泛。举一些简单的例子,我们在 flickr 数据的数据清洗上面还是取得了一些令人振奋的结果。但是在这样的技术上面,我们有很多的问题需要去解决。我们最终需要考虑的是其中有什么样的人、他们在做一些什么样的事情、里面还有怎么样的内容、从一个时间段到下一个时间段有哪些变化、这个变化怎么产生的。实际上我们作为数据领域的研究者还没有特别多关注和投入在这些方面。
我刚才谈到了机器人方面的很多问题,另外一个大的方向是自然语言。大家看到有很多的好玩的聊天机器人,是一种为了好玩的、随意的聊天。但是在我们人和人之间,我们聊天的双方或者是多方是有不同的背景的,整个聊天的过程是有一个希望达成的目的的。对话的目的的理解、利用和算法更新现在都做得不多。所以很多问题,很多聊天的问题是有一个目标需要完成的,这样才能让机器和人类的交流更有价值。我们非常感兴趣将来继续探索这方面的问题。
在谷歌云,我们有非常非常多的传统的行业跟我们进行合作,我们在跟他们交流的过程或者沟通的过程,发觉有好多的问题,我们整个 AI 领域还没有给予特别多的关注,比如说其中一个就是 AI 医疗。
我们知道医疗技术里面,实际上有很多非常非常有意思的问题,比如说我们的医生资源非常少,特别是中国,一个医生一天看上百人的病人,我觉得这对医生来说是非常繁重的劳动,而且病人也没有得到足够的关照。如果有更多的、足够的时间去探讨和理解他的疾病的话,应该会非常有帮助。在很多发展中国家,甚至都没有很多的医生来帮助这些病人解决问题。所以,我们想看看 AI 能怎么样帮助解决这些问题。
这里我想给一个比较简单的例子,我们自己在这上面做了一些小的、比较新的探索,实际上就是让 AI 识别胸部 X 光片。
通常人类医生做这个过程、判断疾病的严重程度非常花时间,而且它对医生的要求也非常高。假设我们如果有一个基于 AI 的 X 光疾病识别算法,就可以极大地减少人类医生的工作量。但这里也有一个悖论:一方面,我们想做这样的 AI 去帮助医生做一些判断,帮助医生对疾病形成更好、更深的理解;而通常现在的技术就是深度学习,如果我们要做这个问题的话,深度学习会需要大量的标注数据才能做出一些成果。这样就回到了我们开始想要解决的问题:我们本来是想帮我们的人员减少他们的工作量,减少他们对数据的处理,结果我们做这些事情,反而要让他们处理更多的数据。
我们这里就开始在看怎么样去解决这个具体问题。通常来说,如果我们要去获取这种标注数据,对做标注的医生要求是非常高的。不过其实我们有很多的 X 光图像都是带有医学的报告的,这些医学的报告来自于以往积累的真实诊疗记录。我们合作研究的医院有十多万张 X 光图像,然而在这么大量的图像里面只有小于一千张有这种带边界框的数据标注。
我们最近一段时间对这个问题进行了一些探讨,去考虑如何用深度学习的方法来解决这个问题。中间我们的 Wang Chong 博士也是对这个项目的学习算法贡献非常大,我们想的是怎么用半监督学习,和这些小量的数据,用一个算法来极大地提高了这些少量数据的有效性。这样的结果我们就可以不但有对这个疾病的类别的判定,同时还能给我们的一些建议,怎么样解决这个问题。
这是一个简单的例子去怎么看从我们如何去设计算法。在我们这个里面,我们还有做很多的尝试,中间包括数据收集和总体解决方案的建立。我刚才介绍到对 AI 医疗的领域,我们整个团队也是非常感兴趣。因为有很多的行业的这种合作,所以我们也会用开放的态度积极参与。用 AI 改善人们的生活是我们非常关注的问题,我们想用 AI 来对相关行业做出更多的贡献。
在中国我们有很多有意思的事情在计划中或者是说已经在执行了,今天给大家介绍了一些我们近期做的技术和产品,给大家分享了一下我们在做的事情。之后的时间里也希望谷歌 AI 中国中心的研究员们能和全中国的 AI 学生、专家、教授们都有更多的合作,合力解决更多尚未解决的问题。
谢谢大家!
(完)