百度机器人实况解说NBA,背后用到了什么黑科技?

2016年,互联网巨头都在秀人工智能的肌肉。继Google AlphaGo下棋赢得人类之后,今天百度又有一个人工智能应用曝光了:度秘实况解说NBA总决赛。据一位百度工程师朋友圈照片显示,在今天上午勇士对骑士的比赛中,度秘模拟人工解说员对比赛进行了实时讲解,同时提供新闻速递和经典回顾。除此之外,度秘还支持互动,能够回答关于比赛的各种问题,比如“库里得了多少分”。

这让我想到了不久之前在谷歌I/O大会上发布的Duo信息应用,这个应用使用了谷歌的人工智能技术,能智能回复信息,比如看到朋友发来的一张图片,它可以识别其中的物体,回复类似于“喔,这只小狗很可爱”这样的信息,还能根据信息内容推荐最适合的快捷回复词汇。度秘和谷歌Duo,都是基于人工智能的“聊天”应用,不同之处在于,度秘是面向NBA比赛的,智能化程度更高一些,它不只是识别某个句子,而是去理解整场比赛,像人一样进行专业解说。

度秘背后的原理是怎样的?据我观察,度秘暂时还未能做到直接看NBA视频来理解比赛,而是通过抓取各种相关的新闻资讯、网友聊天,来实现“实况解说”的,它能够回答用户问题,也是基于对文字的理解。可见,度秘背后最关键的技术,是自然语言处理技术,即NLP。

自然语言处理技术主要是语义理解,比语音识别更加复杂,背后需要以深度学习为基础的人工智能技术。自然语言处理技术是Siri等语音助手变得聪明好用的关键所在,用户说话习惯、断句方式、说话场景不同,背后往往有不同的意图,机器要理解并不容易。基于传统的规则算法是不可能穷举各种表达方式的,只有基于统计的深度学习才能不断提高语义理解的准确度。度秘的应用表明,自然语言处理技术不只是可以用来更好地理解用户的语言,还能更好地理解网络内容,并再次组织,形成以假乱真的“直播解说”。

百度的自然语言处理技术尤其是中文处理技术,经验还是比较丰富的。百度过去一直在做的就是解析用户自然语言形式的搜索请求,并在海量网络内容中寻求答案,而后者同样是自然语言形式。百度不断在尝试去理解人类的语言,以及不同的文字,另一个典型应用是百度翻译,它能够理解不同语言的文章,进行机器翻译,已经达到实用水平,获得国家科技进步二等奖。自然语言处理,一方面需要海量语料、词库的积累,为统计算法提供基础;另一方面,需要模拟神经网络的深度学习算法,这是一个被人类研究了几十年的技术,最近一年实现从量变到质变的突破,不论是AlphaGo还是度秘还是Siri,背后均是类似技术。

AlphaGo战胜人类之后,人工智能这一技术性概念,被全世界熟知,相关应用越来越多,谷歌Home、谷歌Duo、Amazon Alexa、Siri、度秘等等典型应用愈发被人们接受。不管是基于语音还是文字,这些应用的背后,均会用到一个关键技术“自然语言处理”,通过这个技术机器可以理解人类、与人类对话、还有学习世界上的文字去变得更聪明。

在今年百度联盟峰会上李彦宏的演讲主题是人工智能是“下一幕”,所展示的“智能识图”,需要机器去理解人类的问题;此前度秘还进入了上海KFC的一家餐厅,像服务员一样接收人类指令去订餐,这也用到了自然语言处理技术;之前传得很火的机器写稿,背后也是自然语言处理技术,将网络上的文字和数据再次组织起来,跟度秘做的事情很相似。

毫不夸张地说,没有自然语言处理,大部分人工智能应用形同虚设。

“度秘直播解说员”眼下还在内测,很可能会在今年奥运会期间对外开放,为大家解说不同的比赛。相对于传统解说员而言,度秘的解说在生动性上可能会有差距,著名的解说员如黄健翔、柯凡、杨毅们,都有自己的风格,引经据典、旁征博引,还有幽默之类的情感因素,机器短期内是做不到的。不过,机器的好处就是它不知疲倦,可为你解说每一场比赛,并且还能进行个性化定制,每个人都可拥有属于自己风格的解说员,解说员还可以随时回答你的问题。未来度秘与语音合成技术结合起来,就可以做林志玲版、范冰冰版或者你老婆版的比赛解说了,这会让比赛解说变得更加有趣。

除了解说比赛之外,度秘背后的自然语言处理技术,有着许多应用空间。这几年人工智能技术的发展实现了从量变到质变,相关应用将会成为实际,而不是停留在想象或概念阶段,具体来说,以下领域会因为自然语言处理技术的成熟而率先爆发:

1、家庭机器人:家庭机器人需要“能说、会听、会动”,会动就是能做饭倒茶拖地按摩,这一点,是机器人公司在做的事情;而“能说会听”就是人工智能的事情了,需要自然语言处理能力,在语音识别之后,去理解人类的命令,与人类对话。因此自然语言处理技术成熟之后,家庭机器人将会普及,尤其是陪聊类的,例如儿童、老人、单身男陪伴类的,你可以定制一个林志玲回家陪你聊天。

2、客服机器人:不论是电商系统的在线咨询,还是客服电话的在线咨询,现在的体验都很糟糕,主要是要排队等待,很多互联网公司的客服电话,能打进去算是中大奖了,但这些公司又不可能大幅扩张客服队伍,人力成本实在是太高了。有了人工智能的客服机器人,它就可以去理解用户的问题,文字、语音均可,并与用户进行对话,就像真人一样。这将大幅提升客服体验并节省人力成本。

3、助理式搜索:美国曾有一个“人工搜索”引擎,你提出一个问题,有专人去帮你找答案,需要付费。印度的justdial、中国移动12580以及中国电信114热线,同样是基于免费电话的搜索服务,背后有专员给你找答案。这样的搜索服务体验有好的地方,就是个性化的助理,可给你准确的答案或安排你的行程,不过使用成本太高,基于电话不够方便,又费时间又花钱,并未普及。现在自然语言技术成熟,其与搜索结合起来,就可给每个用户提供一个免费的私人搜索助理,基于文字或语音均可。

人工智能是一个很泛的概念,语音识别、图像识别、语义理解、自然语言处理、机器翻译诸多技术均可归为其中,自然语言处理技术则是人工智能普及的基础。在过去,它是人工智能普及最大的瓶颈,现在从谷歌、苹果和百度等公司的动作来看,这个瓶颈很快就被消除了。家庭机器人、客服机器人、助理式搜索、定制化解说,很快就会成为现实。

原文发布于微信公众号 - 罗超频道(luochaotmt)

原文发表时间:2016-06-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏黄成甲

趣谈「增长黑客」

「增长黑客」是一种方法或者理念的概括。指的是利用非常规的、低成本的手段来迅速获取客户,这种手段有时候是技术层面的、有时候是运营层面的。「增长黑客们」则是指一群以...

932
来自专栏科技向令说

响铃:三家齐签Merlin,版权合作后在线音乐的内容运营走向何方?

继网易云音乐、阿里音乐、腾讯音乐陆续完成版权互授协议,在线音乐们终于不用再为了一个版权争得你死我活。除了版权价格降低、用户选择更多之外,比谁膀子粗的时代基本完结...

984
来自专栏罗超频道

说了你可能不信,在AI这件事上谷歌竟开起了小差?

5月18日Google I/O大会召开。从2008年至今,这个大会不知不觉已开到第十界。这个大会呈现了Google对前沿技术的探索。比如曾经给我们留下深刻印象的...

3015
来自专栏罗超频道

互联网体育走向大众化得靠娱乐圈

每逢佳节营销忙,互联网产品越来越亲睐借助于黄金佳节开展重点营销活动,并对此驾轻就熟。今年圣诞和跨年期间,各大互联网巨头便使出浑身解数想要拿下这一关键时刻。腾讯体...

3495
来自专栏灯塔大数据

图文教程,8步教你变身数据科学家!

导读:数据科学家是干什么的呢?哪些地方需要数据科学家?怎么样才能成为数据科学家?如果你正因为这些问题而犹豫要不要开始学习数据科学,那么我可以告诉你,成为数据科...

3184
来自专栏逍遥剑客的游戏开发

游戏开发那些难念的经

引擎设计要以人为本, 这不是一个技术问题, 是需要项目的沉淀和积累的。

32811
来自专栏罗超频道

语音巨头时代来临!谁将是中国Siri?

大约一年前,中国移动以13.6亿人民币的代价获得了科大讯飞15%的股权,后者股价一路攀升,从不足30元到最高61元,成为一大牛股,市值高达240多亿人民...

4039
来自专栏应用案例

鹅厂女专家:用“爱折腾”实现跨界之美

毕业20+年,加入腾讯13年,三个部门,5个岗位,Alicemeng说这是因为自己“爱折腾”,而职业发展也在这不停的“折腾”中变得更加清晰起来。

2K55
来自专栏Linyb极客之路

如果你不想走管理路线,程序员职涯要如何成长?

在你的一生中,持续待在软件工程师这个职位是一个好的职涯选择吗?或是你必须转换到管理职位以继续攀登工程生涯的阶梯?这就是最近在 Quora 上工程师想知道的事,并...

1193
来自专栏Java架构

一个七年Java女程序员的年终总结,写给过去一年的自己第一阶段----三年第二阶段----五年

简单先说一下,坐标杭州,14届本科毕业,算上年前在阿里巴巴B2B事业部的面试,一共有面试了有6家公司(因为不想请假,因此只是每个晚上去其他公司面试,所以面试的公...

1781

扫码关注云+社区

领取腾讯云代金券