品途商业评论讯 北京时间1月11日,在腾讯众创空间CES之夜中,腾讯AI Lab副主任、杰出科学家俞栋介绍了腾讯AI Lab的战略布局及最新进展。
俞栋称,腾讯的AI战略是AI in ALL,把AI用在所有的应用场景中,并通过‘基础研究——场景共建——AI开放’三层架构推进AI战略的实施。腾讯AI Lab有一个比较重要的目标,就是Make AI everywhere(让AI无处不在)。
在研究层面,腾讯AI Lab比较关注四个方向:机器学习的基础理论,计算机视觉,语音识别,自然语言处理。
在游戏AI方面,俞栋表示:“我们不仅研究棋类游戏AI,同时也做智能体和人工环境交互情境下的一些游戏AI研究。因为游戏也是一个训练AI与环境交互,AI与人交互和博弈的重要途径,通过研究游戏AI,我们可以研究如何实现真正的通用AI。” 俞栋还介绍了腾讯在社交AI、内容AI中的最新进展。
据俞栋介绍,腾讯的社交AI通过提升用户与用户之间交互的体验,来增加人与人交互的便利性,同时提供更多人与人的交互方式。通俗讲,就是通过技术手段,使得人与人之间的交互变得便利。比如有些人只懂某种语言,社交AI可以通过语言之间的翻译,让大家能够听懂并交流。
内容AI不仅能理解文本信息,也能理解图像和视频信息。比如,给系统一些图,它可以根据图片生成歌词并唱出来。再如,让AI通过跟踪人的肢体动作来判断对某些要求的动作、规范是否做得到位,可以产生一些更有趣的体验。此外,内容AI还可以做个性化的推荐。以文本推荐为例, AI利用文本本身的信息(比如新闻的信息)、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。
近年,AI+医疗已成为很重要的AI应用场景。俞栋表示,腾讯AI Lab 也做了很多尝试,尤其是在医疗影像和AI辅助诊疗方面,腾讯觅影可以非常准确地识别食道癌和肺癌病灶。在AI辅助诊疗方面,通过分析医学论文和医疗记录等,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的疗法下会有什么样的结果,然后半自动地构建一个知识库。“利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。” 俞栋表示。
俞栋演讲全文如下:
今天,我要介绍的是腾讯的AI策略和已取得的一些进展。因为我的幻灯片用了英语,我将用中文演讲,以照顾在场大多数说中文的听众。
大家可能都知道,在最近的几年里,人工智能变成了一个非常热的词。一方面原因在于人工智能的技术得到了飞速的发展,另外一方面是因为我们看到在很多场景里人工智能确实能够提升我们的生产力。比较常见的几个场景,一个是对话系统,比如说在CES里大家也能够看到有很多的智能音箱以及智能机器人和车,主打人跟机器或者人跟车交互这样的应用。
第二个比较常见的是人工智能技术在真实物理世界中的应用,这会涉及一些,比如说自主决策和自主控制这样一类的技术。
第三类是在已有的一些工业场景里面,之前因为缺少一些技术使得它不够智能化,有很多工作需要人工去做,但现在由于人工智能技术的发展,使得很多机械性的、重复性的工作,或者需要从大数据中发现复杂关系的工作,可以由机器来代替了。
人工智能技术在腾讯目前主要起到赋能的作用。它使得在很多场景里,体验能够做得比原来更好。所以在腾讯,我们的AI战略,叫做AI in All,就是在所有的场景里面,我们都想把人工智能技术用在里面。从组织架构来讲,我们也建立了若干与人工智能相关的实验室;并且在很多不同的产品团队里面,有很多熟悉人工智能技术的工程师。在这些配置里面,其中一个很重要的组织就是腾讯的人工智能实验室,即腾讯 AI Lab。我今天主要介绍在腾讯 AI Lab的一些进展。
腾讯 AI Lab有一个比较重要的目标,就是Make AI everywhere。其实也就是AI in All的另外一种讲法。
在研究层面,我们比较关注四个方向。一个是机器学习的基础理论,一个是计算机视觉,一个是语音识别,还有一个是自然语言处理。
在应用层面,我们有三个重点方向,就是游戏AI、社交AI、和内容AI。我们选择这三个重点方向主要因为它们和腾讯的业务比较契合。
游戏AI,主要是通过人工智能的技术,使得游戏的设计和玩家的体验都能得到提升。大家可能知道,腾讯游戏在整个世界范围都处于领先的地位,所以游戏AI有很多的应用场景。
第二个是社交AI,它的目标就是要通过使用AI技术来更好地提升人跟人,人跟机器的交互。这也是因为腾讯有两大主要的社交网络,一个是微信,一个是QQ。
另外一个就是内容AI,我们希望通过理解内容来更好理解用户,来给不同的用户提供不同的、个性化的服务。
在游戏AI领域,我们最早做的是棋类游戏,比如腾讯的绝艺,就是我们研发的围棋AI。在之前机器围棋国际性顶尖比赛UEC杯中,绝艺11连胜得到了冠军。
但是我们的游戏AI研究并没有止步在这里,因为我们觉得游戏AI不仅仅可以提升游戏的能力和玩家的体验,同时它也是一个非常好的研究人工智能技术的环境,是一个研究智能体怎么和环境、怎么和人交互和博弈的一个场景,所以我们能够通过研究游戏AI,来慢慢地研究如何实现真正的,我们叫做通用人工智能的技术。所以在这方面,我们就不单单只是做围棋AI,我们同时也做智能体和人工环境交互情境下的一些游戏AI研究。
在社交AI领域,我们通过技术实现人跟人交互的更新的更有效的方法,以此提升人跟人交互的便利性和体验。
举个例子,就是通过技术手段,使得人跟人之间交互变得更容易。比如说有些人,他只懂某种语言,但我们可以通过语言之间的翻译,使得大家能够互相听懂。
我现在播放的是一个在今天来说比较常见的同声翻译的demo(演示),很多公司现在都有这个能力。通过结合语音识别技术和机器翻译技术,我们可以打破语言障碍,使人和人之间的交互变得更容易。
在内容AI领域,我们不但要理解文本信息,也要理解图像和视频的信息。这样,我们一方面能够更好地理解内容本身,同时通过理解内容,也可以更好地理解用户,给用户提供更好的推荐。另外,我们也通过理解内容,反过来可以生成内容,这是更难的一步。
举两个例子。一个是通过建立图像跟自然语言之间的联系,我们可以做很多事情。比如在照片下面我们可以自动加上标注,或者可以通过给定一张照片,找到其他类似的照片。另外,你也可以提供照片或者video(视频),让系统做其他事情。这里的demo(演示)就是看图唱歌,就是给一些图,它可以根据图片生成歌词并唱出来。下面是demo(演示)。
这就是一个简单的例子,结合图像识别和理解技术以及语音合成技术。当然这里不是一般的语音合成,它涉及韵律,是更类似音乐合成的技术。我们可以看到,把不同技术衔接起来,可以产生一些人跟人之间交互的更友好的手段。
另外一个例子,就是通过计算机视觉技术能够跟踪人的姿态变化。然后,产生一些更有趣的体验。我们也可以放一个demo(演示)。
右边的demo(演示)就是通过跟踪人的肢体动作来判断对某些要求的动作、规范是否做得到位。
另一方面,通过内容AI,我们可以做个性化的推荐。这里是文本推荐,就是我们利用文本本身的信息,即新闻的信息、阅读人的信息和当时的环境,还包括他的朋友的信息,我们可以做到比较精准的推荐。
当然,在最近的几年里面,还有个很重要的人工智能应用场景,就是AI+医疗。AI Lab 也做了很多尝试,尤其是医疗影像和AI辅助诊疗上面,我们可以做到非常准确地识别食道癌和肺癌病灶。即便给定的训练样本只告诉系统有还是没有癌症,但没有标注在什么地方有,我们的技术也能自动地判断在什么位置有病变。这个比原有的技术有很大的提升。
另外,我们也在研究AI辅助诊疗,通过分析文本,包括分析医学论文和医疗记录,可以更好地了解某种疾病有些什么病症,发展下去有什么样的变化,在不同的treatment(疗法)下会有什么样的结果,然后半自动地构建一个知识库。利用这样的知识库,我们就可以做辅助诊断,不仅能够加快诊疗并且能让诊疗变得更准确。
我们把许多基本的人工智能技术和能力包装起来变成API和SDK,以便大家使用。这些能力包括语音识别、合成、翻译、情感识别、文本分析和理解、物体识别,也包括闲聊等,然后放在开放平台上。有两个渠道大家可以使用我们提供的能力,一个是AI.qq.com,另一个就是腾讯AI加速器。谢谢大家。
领取专属 10元无门槛券
私享最新 技术干货