【金融客服AI新玩法】语言学运用、LSTM+DSSM算法、多模态情感交互

编辑:张乾

【新智元导读】目前,金融业智能客服创业公司大量涌现,一方面说明行业整体技术壁垒较低,另一方面,也说明智能客服的在金融领域的应用商业场景还有巨大的开发空间。如何在构建技术壁垒的同时开发更多的商业场景,是创业公司能够脱颖而出关键。

目前,人工智能已经在金融领域渗透:智能客服、智能投顾、人脸支付、智能安防等,已经进入商业化阶段。在这些应用场景中,智能客服属于获客机会最大的业务。

埃森哲(Accenture)去年的《全球消费者消费渠道与市场调研》显示,在银行、保险等金融行业,有七成的消费者愿意选择人工智能客服为他们的消费决策提供建议。正因如此,市场上涌现出大量的智能客服创业公司。

创业公司广泛存在一方面说明行业整体技术壁垒较低,另一方面,也说明智能客服的在金融领域的应用商业场景还有巨大的开发空间。如何在构建技术壁垒的同时开发更多的商业场景,是创业公司能够脱颖而出关键。

三大痛点:传统NLP方法对意图和语意理解不足、缺少深度学习训练模型数据、无法精确感知用户情绪

通常意义上的智能客服系统有语音客服、文字客服两大形态,其核心技术主要由语音识别、自然语言处理、语音合成组成(部分还涉及到计算机视觉)。其中语音识别与语音合成技术相对比较成熟,但中文的语义理解由于汉语自身的复杂性(诸如分词、歧义、缺乏形态变化、结构松散等),技术难度较大,也被很多业内人士誉为人工智能皇冠上的明珠,也是能否实现高质量人机交互的关键。

智能客服系统框架(图据恒生研究院)

对于智能客服机器人而言,语义理解与意图识别决定了对话机器人的回答准确率。随着深度学习在自然语言处理中的运用,训练数据的质量也成为了智能客服开发的关键。特别是服务于金融、电商等垂直行业的智能客服,相关领域的对话训练数据的质量直接决定了深度学习模型的训练质量。深度学习的运用也成为区别新一代智能客服区与传统以关键词、模版为核心的问答机器人的关键。

另一方面,客服知识库是智能客服的核数据,它存储了所有的问题和相应的答案。用户的提问,将匹配到知识库中的问题,从而将正确的答案返回给用户。知识库的好坏直接决定了智能客服的服务质量和用户体验。

回到金融领域,智能客服的应用解决了金融企业有限的真人客服与庞大的用户服务需求之间的矛盾,以及24小时在线的问题。通过智能客服还能将海量的用户对话数据转化为业务洞察,为后端的精准营销与持续的业务优化提供参考依据。

不过,智能客服在金融领域的应用仍然面临一些挑战:

1、由于金融领域涉及的专业知识与词汇较多,传统NLP方法无法准确理解语义与客户意图。

例如,客户问“中国联通的股票据说要跌?”在分词上,普通的NLP可能会将这句话分为中国联通的股/票据/说要跌?。分词上的错误会直接影响到语义的准确理解,让智能客服无法理解问句背后的真实意图,并作出回答或处罚某些技能和服务。

2、缺乏深度学习模型训练数据。

单纯从业务数据上来讲,金融的数据尤其是交易信息数据非常大,这跟金融业务信息化较早有关。但用户的业务咨询数据、客服数据、金融产品的导购对话数据,长期没有得到充分重视,也缺乏积累和开发,因此可用来进行深度学习的训练数据并不充裕。

3、无法精确感知客户情绪(如电话客服系统)。

金融领域,人类情绪极易随着金融行业市场的波动而起伏不定,经常难免带有情绪与客服沟通,因此带有情感识别与分析的人性化人机交互体验就显得更为重要。当智能客服普遍没有感情时,一个稍微有些“感情”的智能客服系统就会更容易被选择。

技术新招:语言学运用、LSTM+DSSM算法、多模态情感交互等

针对前述问题,在语义理解方面,目前比较新锐的做法是以传统的NLP技术打底,加上语言学结构,结合新的机器学习、深度学习、以及金融知识图谱的方法,融合地去把整个语义理解抽象化后做降维。

目前使用上述方法的竹间智能,其语义理解算法包含言外行为分析、语义角色标准、命名实体识别等四十余个模块,且已迭代至第四代,尝试了对抗生成网络等众多新方法。真正做到金融领域的语义层面的抽象和理解,而不是单纯字词层面的分析。

同时,竹间智能还在金融对话机器人中大范围的利用深度学习。从分词、词性、语法解析、信息抽取等基础模块,到自然语言生成、机器翻译、对话管理、知识问答等高层的NLP领域,几乎都可以应用以CNN、RNN为代表的深度学习模型,并取得不错的效果。

智能客服眼下已是各大服务平台的标配,但多数客服更接近于一个搜索引擎,将用户输入的关键词与数据库的相关答案匹配。对于口语化的提问,这样的智能客服往往很难给出“智能”的回答。蚂蚁金服的LSTM+DSSM

(Long Short-Term Memory + DeepStructured Semantic Model)算法能够对用户语义和意图进行很好的理解。用户问题回答得越多,越精准,尤其对于口语化、表述不够完整的提问,机器能够主动理解。

例如,当用户向支付宝智能客服提问“如何退款?”时,这种没有上下文的问询,也意味着没有场景。通过LSTM对用户行为轨迹做一个编码,通过深度排序模型,结合用户之前的历史操作,系统能够判断用户的诉求更接近“转账到账户转错了怎么办?”,而不是“为什么银行卡转账被退回来了?”。

同时,用户来到客服解决问题,往往并不明确自己的问题所在,因此他们的提问也往往很模糊,甚至存在很多缺失的信息。这个时候,反问就很重要,可以通过多轮的交互,来逐步明确用户的真实诉求。

多轮交互一直是对话系统一个很大的挑战,传统的基于语言理解和对话状态跟踪的多轮对话技术并不适用于客服知识问答。蚂蚁金服用问题结构化的思路来解决客服多轮对话,通过算法辅助以人工,对客服知识库中的每个问题进行结构化,搞清楚每个问题是由哪些要素构成的。对用户的提问我们同样识别其中的要素,看看可以匹配到知识库中的哪些问题。如果发生了要素缺失,就反问用户,让用户进行补充和确认。

针对金融领域对话机器人深度学习模型训练数据的缺乏,迁移学习是一个有效的尝试。迁移学习的目的是从一个或多个源任务(source tasks)中抽取知识、经验,然后应用于一个有相关性的目标领域(target domain)中去,从而实现在金融领域跨行业、跨领域的知识学习。

目前,竹间智能尝试使用迁移学习方法,让对话机器人能够跨领域、跨行业学习。尤其当金融类客户在客服、导购等领域面临训练数据缺乏时,在竹间现有训练过的模型基础上做迁移学习可以很大程度上提高模型的性能,达到更好的机器学习效果。

由于情感在人类信息沟通中的意义重大,所以情感计算也是实现人性化的人机交互中必不可少的组成部分,情感识别与理解技术也正逐渐成为人机交互的基础性技术之一。

竹间智能尝试建立起了一套多模态的情感情绪交互模型来解决情感计算的问题。通过找到人机对话中隐藏的信息状态并加入到计算中,并结合内外部的多模态设计,即文本+emoji+照片+表情包+文本长度等,与外部的多模态,即加入面部表情识别+语音情绪识别+提供的标签(比如性格,星座,爱好,年龄,性别等),来实现更深的的语义理解和多模态情感交互分析,从而达到人机交互过程中对人更深层次的理解。

竹间多模态情感识别展示傅园慧视频

此外,在知识库构建方面,对于传统的知识库而言,其构建往往依赖于人工运营,由运营专家根据自己的业务经验来决定知识库中会有哪些问题。这样的构建过程需要很多人力成本,后期维护成本也很大,而且并不能发现用户的真实诉求。蚂蚁金服的做法是从过往海量的客服对话记录中,通过文本聚类算法,将相似的问法找出来,形成很多聚类,每个聚类就是一个用户关心的问题。

这样的做法还有一个额外的收益就是,聚类算法本身找到了每个问题所有可能的问法,这样就为在线的问题匹配提供了宝贵的数据,用户的提问只要模糊匹配到某个问题的任何一个问法,就可以知道用户想问的是这个问题,这样极大的提升了客服问题匹配准确率。这样一个基于数据挖掘的知识库一直处于自学习的状态, 就可以持续的提升智能客服的效果。

从幕后走向台前:智能客服打开更多营销空间

客服部门是银行业务中劳动密集型部门的之一,一家中等规模以上的银行甚至有数千名员工接听客户电话,人工智能可以大幅降低金融业务成本,提升业务效率。

据21世纪经济报道,光大银行电子银行部总经理杨兵兵曾表示,人工智能在银行业务中最早的应用便是智能客服。光大在引入智能客服后,“最近三年每年呼入的话务量有10%的速度增长,但是三年来我们没有增加一名客服。”杨兵兵说,去年光大银行的话务中有近60%是模拟人工服务。

同时,随着人工智能在客户服务领域的不断拓展、互联网获客成本越来越高,智能客服逐渐由售后转向售中和售前,承担起更多企业营销任务。

竹间智能CEO简仁贤介绍,竹间智能将售后、售中、个性化交互三者结合,可以形成端到端的解决方案。

去年底,兴业证券优理宝App上线“小兴机器人”智能客服,它背后正是竹间AI证券机器人解决方案,帮助其实现了智能客服、投资者教育、产品咨询、多轮对话与上下文记忆在内的一系列服务与功能。

“小兴机器人”智能客服

简仁贤还透露,在今年第一季度将推出新版的财富管理机器人,将对话机器人实现投资者教育、智能投顾、财富管理。目前,竹间智能的收入主要来源于对话机器人应用,如智能客服、导购机器人、企业助手、个人助理、语义理解、情感情绪分析等,并有望靠自身业务在2018年实现全年的收支平衡。

著名呼叫中心运营及顾问培训专家、亚太客服与呼叫中心联盟APCCAL的发起人以及客户世界机构(CCMWorld Group)的创办人赵溪认为,人工智能完全替代人工客服还为时尚早,但是会对结构化、标准化的客服工作进行替代,这有非常大的市场潜力。

“客服中心是企业对内对外数据整合的一个平台,有大量的数据,因此在大数据的背景下,有更大的挖掘的空间。”赵溪说。

此外,图像识别等技术也越来越多的应用到智能客服中,丰富和拓展了金融客服的场景。蚂蚁金服资深算法专家张家兴介绍,去年7月,蚂蚁金服份发布车险的图像定损功能,今后用户有望直接通过手机拍摄图片,就知道事故车的损害情况以及赔付金额。

“拍照定损对保险业的冲击来说是根本性的,它整个改变了保险业理赔的工作模式。”张家兴说,拍照定损将来还能广泛应用到生鲜电商等多个领域。

原文发布于微信公众号 - 新智元(AI_era)

原文发表时间:2018-01-15

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏数据的力量

如何成长为顶级数据分析师和数据挖掘师?

2166
来自专栏钱塘大数据

《哈佛商业评论》:人工智能商业之路的机遇和挑战

250多年来,经济增长的根本动力一直是技术创新。其中最重要的是经济学家所谓的通用技术——包括蒸汽机、电力和内燃机。每一个都催化了互补创新和机遇的浪潮。例如,内燃...

38211
来自专栏互联网数据官iCDO

《让数据说话—浅析数据分析在销售管理过程中对企业发展的价值》

前言:“数据(data)”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现以数据为基础驱动公司内部和外...

3075
来自专栏产品成长日志

转型AI产品经理需要掌握的硬知识(一):AI产品经理能力模型和常见AI概念梳理

近几年,从亚马逊, Facebook,到谷歌,微软,再到国内的BAT,全球最具影响力的技术公司都将目光转向了人工智能( AI )。2016年 AlphaGo 战...

2643
来自专栏AI科技评论

盘点丨2016 这一年,深度学习开始主宰互联网

AI 科技评论按:2016 即将画上句号,当我们回顾这一年的科技进展时,很难不联想到一个词——深度学习。当它从研究室中脱胎而出,并成为今年的当红热词,实际上我们...

3486
来自专栏人工智能

在人工智能领域, 开发人员需要什么技能?

​为了收集有关人工智能(AI)及其所有变体(包括机器学习(ML),深度学习(DL),自然语言处理(NLP),预测分析和多重神经网络)情况的见解,我们与22位熟悉...

1K5
来自专栏summer it专栏

大数据时代(BIG DATA)

结语,正在发生的未来。凡是过去,皆为序曲。历史最悠久的做事方法并不是最好的。大数据时代是名副其实的“信息社会”。大数据给我们带来了巨大的风险,但我们可以建立规范...

2695
来自专栏人工智能头条

机器学习与模式识别是走在正确的路上吗?刘成林、李航、周明等这样回答

3036
来自专栏量子位

提到强化学习只知道AlphaGo?其实,RL在工业界还有这些应用

原作 Ben Lorica 唐旭 编译自 Oreilly 量子位 出品 | 公众号 QbitAI 关于作者: Ben Lorica,O’Reilly Media...

2973
来自专栏Albert陈凯

大数据到底怎么学:数据科学概论与大数据学习误区

作者|杜圣东 “数据科学家走在通往无所不知的路上,走到尽头才发现,自己一无所知。”-Will Cukierski,Head of Competitions &...

3567

扫码关注云+社区

领取腾讯云代金券