智能人机语言交互的时代真的来了吗?

diwang(王迪)

本文作者:内部搜索平台部自然语言处理中心总监,专家工程师。毕业于中科院计算所,2008年7月加入腾讯,一直从事自然语言处理和搜索技术相关工作,先后参与过搜索广告、网页搜索、问答、音乐、应用宝等垂直搜索,以及新闻个性化推荐产品的研发工作。

4月12日Facebook在旧金山召开的F8开发者大会上,公布了Messenger企业平台(Business On Messenger platform),开发者可以通过其开放的聊天机器人API,构建基于Messager平台的自己的聊天机器人,通过聊天的形式为用户提供客服、天气、订餐、资讯、购物等服务。这是继2015年推出虚拟助手应用M之后,facebook在聊天机器人领域的又一次重大动作。Facebook希望基于聊天机器人开放api,其平台上入驻的近5000w商家可以打造自己的聊天机器人,为facebook的九亿用户提供各式各样的服务。David Marcus是Facebook聊天业务的VP,他的愿景是机器人会推动后APP时代的世界,聊天是未来的网页,Messenger是未来的聊天。

说到聊天机器人,我们自然会想到苹果的Siri、微软的小冰和Cortana、google的Google Now,以及百度的小度机器人和度秘等产品。IBM的智能问答机器人Waston也可以算作聊天机器人的一种,只是Waston更偏重知识问答。随着这次facebook聊天机器人开放平台的推出,预计未来几年聊天机器人领域也将会变得更加火热。

随着移动设备和智能终端的普及,用户与机器交互的媒介也在逐渐发生变化,越来越多的用户更喜欢以语音自然语言的方式进行交互。想象一下,未来我们面对一个家务机器人的时候,你是愿意在他的屏幕上各种输入呢,还是更愿意躺在沙发上对他说几句就搞定了呢?语言是人类交互最自然的方式。因此近年来语音识别、聊天机器人领域在工业界和学术界也变的备受关注。

从提供的功能和场景上来看,聊天机器人可以分为情感聊天型、个人助理型、知识问答型、智能客服型。情感聊天机器人主要是为用户提供情感陪护、精神慰藉的功能,以生活化聊天为主,典型应用是微软小冰,小黄鸡。个人助理型机器人,通过语言交互系统实现个人事务的查询、处理,以及商业化服务的代办,比如收发邮件、设置提醒、订餐、购物等,典型的产品有Siri、Google Now、Cortana。知识问答型机器人主要功能是回答用户以自然语言形式提出的知识型(事实和非事实类)问题,帮助用户获取特定领域的专业知识,以IBM的Watson为代表(2011年Watson在智力竞赛节目Jeopardy中战胜人类冠军取得胜利)。

智能客服型机器人主要为产品客户提供关于产品服务的查询、反馈、售后等服务,减少大量的人工客服需求,以京东的JIMI机器人为典型代表。未来基于Facebook的机器人API第三方商家可以根据需要构建不同功能组合的机器人。近几年聊天机器人在工业界和学术界引起了广泛的关注,但不管是实际产品体验效果,还是学术研究的效果,都远没有达到让人非常满意的程度。很多人使用微软小冰和Siri,都是调戏和娱乐为目的。背后的最主要原因,还是自然语言理解的复杂性和困难,相较于AlphaGo机器人战胜李世石,目前机器对语言关键问题的处理还处于比较初级的阶段。比如下面这个小学一年级的语文阅读题目,相信大部分6岁的小朋友都能轻松给出答案,并且也能轻松应对类似的题目。然而这样一个题目,我们现有的聊天机器人基本上无能为力(即便是为解决该问题进行了专门的优化,变换其他类似问题也比较困难)。

事例一

转眼间,冬天又到了,刺猬要冬眠了。他刚把门关上,就听到有人敲门,原来是小鸭子看到他。小鸭子说:“刺猬大哥,为了治好你的关节炎,我把平时蜕下来的毛织在一起,给你缝了一条柔软的鸭绒被,这样,你整个冬天都能睡得暖和了。”问题:1、文章写了( )送给刺猬( );2、哪个小动物生病了,是什么病?

以这段文字为例,在技术上还存在不少关键难点亟需突破,比如:(1)语义的理解和表达。冬天-时间、刺猬-动物、他-代词是一种语义维度;毛是鸭子的一部分 也是一种语义维度;缝-谓语、柔软-定语、鸭绒被-宾语 是一种语义维度;刺猬和鸭子都是小动物、刺猬和蛇都会冬眠 也是一种语义维度;语义并没有一个严格的定义,在不同的场景使用不同的衡量维度,人可以灵活处理这些变化。机器怎么准确这些语义,并根据不同的场景需要,选择合适的维度呢?

事例二

2)聊天上下文一致性的处理,下面这个例子是一个典型的聊天机器人自动回复的结果,Q:你的孩子几岁了?A:我儿子五岁了 。Q:孩子男孩还是女孩?A:我生了个女孩,很漂亮。Q:什么时候怀孕的?A:前年。

这里涉及到上下文补充,指代消解,以及语义一致性的问题,机器如何获取、存储知识,并根据知识指导答案,目前还很难处理地很好,所以才会经常出现这样前后矛盾啼笑皆非的情况。

事例三

归纳推理和演绎能力缺失,比如“将《世上只有妈妈好》这首歌改成爸爸唱一遍”对一个三岁的孩子来说几乎没有什么难度,然而对机器来说却异常困难,机器想要理解这个题目本身就是一件很有挑战的事情,更不用说利用爸爸-妈妈对等关系进行归纳类比应用了。

事例四

情感的理解和表达,可以认为是机器人的情商。通过用户文本或者语音输入,判断用户的喜怒哀乐等情绪,使用恰当的情绪进行自动回复,这也是一个很有挑战的问题。

归根到底可能还是因为我们对人脑如何存储、处理、理解、使用语言并没有完全掌握,现在还没有办法对这些问题进行完备的建模。近年来deep learning在图像和语音领域在学术界和工业界都取得了突破性的进展,越来越多国内外研究人员也开始引入deep learing来解决NLP相关的问题。

虽然聊天机器人在技术上还存在不少挑战亟需解决,但在一些限定领域的场景下,问题就会变得简单很多,可以取得让人较为满意的效果。但是真的可以通过图灵测试的聊天机器人,要像“大白”一样可以与人准确、自然、带情感地交流,未来的路还有很远。

原文发布于微信公众号 - 腾讯技术工程官方号(Tencent_TEG)

原文发表时间:2016-04-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Java帮帮-微信公众号-技术文章全总结

【大牛经验】成为项目经理并保持竞争力

项目经理职位在一流的互联网公司至少需要奋斗三年以上,如何缩短这个非常漫长和艰苦奋斗的过程,我建议从以下几个方面做起。

13630
来自专栏机器学习之旅

总结:如何找到一份机器学习的工作

我选择了公司的校招中比较严格的(top5%)一个jd要求,我们看下如何拿下这个offer。

11730
来自专栏企鹅号快讯

“人工智能”超越人类还需多少年?

译者│枫凌 点击标题下「翰文网」可快速关注 “奇点”将在2045年左右到来 人工智能的进步令人惊叹。人们一直在争论这种能力超越人类的“奇点”(技术的奇异性)是否...

35960
来自专栏逍遥剑客的游戏开发

游戏开发那些难念的经

引擎设计要以人为本, 这不是一个技术问题, 是需要项目的沉淀和积累的。

332110
来自专栏大数据文摘

北京大学新浪:2015 年中国 90 后媒介使用专题研究(附全文)

21450
来自专栏大数据文摘

数据改变新闻!哥大新闻学院给记者开设了大数据课程!

25570
来自专栏大数据文摘

长文|为什么微软把未来赌在AI(人工智能)上?纳德拉超越谷歌的计划

318120
来自专栏Java学习网

程序员的有效学习策略

程序员的有效学习策略 九月初我在新西兰举行的Kiwi PyCon会议上做了一个主题为“程序员的有效学习”的主题报告。主要讲到了两个方面:一个是对智力的认识,一个...

26380
来自专栏CSDN技术头条

Facebook F8开发者大会详解:从虚拟现实到聊天机器人

引言:周三和周四两天,Facebook的F8开发者大会如火如荼地召开着,其中有多项新产品和新功能宣布。这些产品和功能为什么对Facebook这个社交巨头如此重要...

20850
来自专栏企鹅号快讯

2018年AI将面临更多的挑战

2017年,我们亲眼目睹了人工智能领域的数个重大突破。可是如果你最近和Siri或是Alexa聊过天,你就会发现在风口之下,仍有许多东西是AI无法理解的。以下我们...

210100

扫码关注云+社区

领取腾讯云代金券