想打造一个不智障的聊天机器人?这里有六条实战指南

李杉 编译整理 量子位 出品 | 公众号 QbitAI

苹果推出Siri已经7年,杰夫·贝索斯(Jeff Bezos)受到《星际迷航》的启发推出Alexa也已经3年。

其实,以人工智能为基础的互动界面早在数十年前就已经出现。1966年,麻省理工学院教授Joseph Weizenbaum推出了ELIZA——这被普遍是做当今对话型人工智能的原型。

几十年后,在《连线》的一篇报道中,Andrew Leonard声称“机器人将会大热”,而且认为这种几乎技术很快就能“帮我找到最划算的CD,给我母亲选花,让我能报道莫桑比克的最新进展。”由于该文发表于1996年,所以举例时使用了早已过时的CD。

如今,Slack、星巴克、Mastercard和梅西百货等公司都已经通过改变,在客户服务、联网家居和网上订花等诸多领域使用对话型界面。

如果你怀疑这项技术的价值或前景,可以看看Gartner对2019年之前的预测,这家市场研究公司认为,虚拟个人助手“将改变用户与设备互动的方式,成为生活中普遍接受的一部分。”

并非所有的对话型人工智能都是平等创造的,也不应如此。对话型人工智能包括虚拟个人助手(Alexa、Siri、Cortana和Google Home)和专业助手(X.ai和Skipflag)两类。它们可以基于一套规则引擎开发,也可以使用机器学习技术。用例范围既包括具体而琐碎的任务(塔可钟的TacoBot),也涵盖通用而广泛的服务(Alex、Siri、Cortana、Google Home)。

很多组织也考虑在个人或职业领域部署对话界面,通常都依靠合作伙伴提供的技术。但除了技术之外,仍有很多需要考虑的问题。虽然现在称之为“实战指南”还有些为时尚早,但各大组织在考虑尝试或部署对话型人工智能时还是参考以下几点:

1、从一个有明确答案的小领域切入

“重点是产品或品牌。”Slack开发者关系总监Amir Shevat说,“不应该想‘我在开发一款机器人’,而应该这么想:‘我要提供什么样的服务?’”

Shevat和其他人认为,除此之外,最好的启动点是寻找那些可以用大量数据数据缓和或解决的棘手问题。这并不是说所有成功的机器人都应该做同一件事情,但关键要从一个有明确答案的小领域切入,然后设计一番用户通常不知道自己可以享受的体验。

2、目标决定互动模式

有的对话很适合语音互动。例如,开车的时候或者要开启家中暖气的时候。但在询问银行余额这样的情况下,或许就需要通过文本输入精确的隐私信息。但还有其他方式可以帮助用户与机器人互动。下图显示了两种成功的互动例子。

“很多人仍对机器人有一种误解,认为只能说话或打字。”微软的Chris Mullins说。事实上,机器人可以通过许多方式(或形态)与人互动或传递信息:

  • 语音(Alexa、Siri、Google Home)
  • 打字(聊天应用中的机器人)
  • 通过键盘支持来提供线索,从而缩小输入选项的范围
  • 展示视觉化信息的卡片

“在最成功的情况下,”Mullins说,“我们会看到一种混合的形态胜出。在合适的时候,语音很完美。但在其他时候,打字又很完美。有的时候,你也想使用卡片或键盘支持。确定对话模式是一种及其难以解决的问题,还没有人能够完全搞定。”

3、认真规划和明确选择多重背景

如果一个顾客向零售商询问这样的问题:“在我附近的店里,哪里能找到电钻?”开发者就必须根据客户所在的位置考虑问题。她现在是否身处店内?她在使用手机还是家里的电脑?开发者必须针对多重场景和体验进行设计。

这一过程很有挑战,因为需要在确定范围的过程中设想不同的互动模式。“与人类互动非常复杂,确定对话模式很困难。”Mullins说。要实现最好的效果,项目团队就必须从一开始就做出选择。

4、持续的互动需要持续理解背景信息

要理解“播放碧昂斯的《Lemonade》”和“查查我的银行余额”这种单一命令是一回事,而要针对人类与聊天机器人之间的互动编写程序则是另外一回事。正因如此,人类与机器人展开的多重交流(“回合”)才如此复杂和难于开发,这需要充分理解背景信息。

下图是一个来自Kasisto的例子,表明了简单的支付互动过程中蕴含的复杂性。

第一回合:

  • 用户让Kai(聊天机器人)向Emily支付5美元。
  • Kai在用户联系人列表里面找到两个名叫Emily的人,询问究竟是哪个Emily。

第二回合:

  • ——用户转换话题,询问自己的账户还有多少钱。
  • ——Kai回答后,接着说,“我们现在说到哪儿了?”然后继续最初给Emily支付5美元的话题。
  • 起初看来,这像是一个非常简单的互动,但从工程角度来看,却需要深入理解背景和语言:
  • 首先,Kai必须认识并追踪用户的目标,具体到这个案例,付钱给某人。
  • 第二,Kai必须确定支付对象。在发现用户有两个叫Emily的朋友时,就需要通过询问来确定具体的支付对象。
  • 第三,Kai必须明白“Neubig”这个独立出现的单词是在指代前面对话中的内容,意思是付钱给Emily Neubig。
  • 第四,Kai必须解读“我账号里有多少钱?”这句话的意思,明白这是一个全新的请求,与之前的两个互动并不相同。
  • 最后,它还必须回答这个新的请求,然后继续刚才的对话,完成最初的请求:向Emily支付5美元。

这段对话证明,为什么明确的目的、缩小回答范围和深入的专业知识都对聊天机器人的开发至关重要——因为要在用户通过自然的方式表达时理解其意图是一件非常复杂的事情,但如果想要提供有效的体验,这一点却至关重要。

5、EQ跟IQ同样重要

高超的智能和明确的用户意图并非机器人取得成功的唯一要素,探测情绪、选择合适的文字和语调同样是确保舒适的对话体验的关键。因此,很多实验室和创业公司都在开发一些软件,通过图片、语音、文本或视频来探测情绪状态。。

SRI International的语音技术和研究实验室就开发了SenSay Analytics平台,号称可以通过语音信号感知说话者的情绪。这样才能知道用户何时感到困惑,并为其提供人类互动对象,也可以判断用户是否善于接受,从而为其提供相关的内容。

6、品牌化机会很小,但很有效

品牌化是机器人取得成功的关键因素。效果不佳的机器人会破坏声誉,而强大的品牌触角也可以帮助机器人取得成功。“我认为,对话型界面中的品牌化机会相对较小。”Adobe的Lars Trieloff说,“所以,应该在日常互动中利用品牌。确保它能把一件事情做得很好,完全符合客户诉求。”

目前还处在利用对话型界面的初期,还有很长的路要走。但对话型人工智能——那些能够更好地模仿人类的方式与机器互动的程序——将会扎根于此。现在可能有些原始,但数据科学、自然语言技术、机器学习和其他科技的进步,最终会为更加流畅的人机互动创造必要的环境。

对话型互动是否会等同或好于人类之间的互动?有些类型的互动可能永远都不容易通过机器展开。但对某些用途而言,或许可以实现这一愿景:我们已经看到了很多创新,但现在只是冰山一角。

有一件事情是确定的,正如未来学家和创意策略师Monika Bielskkyte所说:“我们正在进入一个没有屏幕的未来。”她预计,“未来,整个世界就是我们的桌面。”

原文发布于微信公众号 - 量子位(QbitAI)

原文发表时间:2017-08-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏腾讯云TStack专栏

如何自下而上在腾讯做开源?

1772
来自专栏灯塔大数据

原创译文 | 2017年聊天机器人未达到行业预期的3个原因

导读:上一期了解了2018CES的相关介绍,今天我们来了解一下关于聊天机器人的相关内容(文末更多往期译文推荐) ? 持续几年的“聊天机器人革命”带来了巨大的期望...

3459
来自专栏腾讯开源的专栏

腾讯刘昕:如何自下而上在腾讯做开源

本文为腾讯移动互联网事业群总经理刘昕,作为腾讯开源顾问和Linux基金会董事,在LC3 国际开源盛会上,介绍的腾讯部分开源成果。

9.3K5
来自专栏互联网杂技

Airbnb团队负责人:硅谷新兴的产品内容策略分析师是什么

Marissa Phillips 是 Airbnb 产品内容策略(Product Content Strategy)团队负责人,就职于旧金山总部。2016 年加...

1153
来自专栏zhisheng

微信之父张小龙首次公开演讲全文:希望用户合理用微信

可能会有一些朋友觉得比较突然,我也是比较突然进来参加这样一个会议,很高兴在这里跟大家碰面。平时我很少参加会议,可能很多人都搞不懂,其实我们同事都知道,我一直有...

3836
来自专栏liulun

小团队管理与大团队管理

我们公司和大部分传统软件公司一样,随着业务的发展和新领域的开拓,公司的管理风格越来越像华为,这是不是最佳的演进路线,我觉得值得探讨,以下是我的思考,希望跟大家讨...

1576
来自专栏张善友的专栏

培养敏捷态度

关于敏捷方法论的文章已经很多了。其中,相当一部分文章讲述了敏捷方法技术方面的问题,比如测试驱动开发和持续集成。同样,还有相当一部分文章讨论了敏捷 方法论的应用问...

1996
来自专栏大数据钻研

从普通JAVA程序员到BAT架构师,他用了这套学习方法!

近年来,中国互联网三巨头BAT(百度、阿里、腾讯)均耗费巨资投入大数据发展,纷纷建立大数据研究院、大数据实验室等,提供大数据专业服务,一批大数据专业分析公司也应...

873
来自专栏BestSDK

物联网智能时代的风口——边缘计算

什么是边缘计算? 为了定义的缘故,当边缘服务器是指内容传送网络(CDN)中的服务器的术语时,广义的边缘计算似乎起源于近20年前。它最近出现在处理,分析和应用网络...

3034
来自专栏灯塔大数据

原创译文 | 五大攻略——教你玩转2018年语音营销

导读:上一期学习了人工智能的相关介绍,今天我们来了解一下关于语音营销的相关介绍(文末更多往期译文推荐) ? 嘿,Alexa,放点音乐。 好的,谷歌,打开灯。 五...

3349

扫码关注云+社区

领取腾讯云代金券