干货 | 携程度假智能云客服平台

作者简介

李健,携程度假大数据开发总监。2013年底加入携程,在攻略社区及度假负责自然语言处理、图像、推荐等领域的开发管理工作。

写在前面

在人工智能时代, AI技术会以提供更精准更高效的方式在流程改进、沟通费力度下降、沟通效率提高、成本降低及收益提升等众多方面全面改变目前的商业模式、推动业务发展。携程度假的智能云客服平台在这方面做了很多有益的尝试,大大提升了携程度假客服的效率和用户体验。

一、智能云客服平台概述

在智能云客服平台上线前,在包括IM/微信、在线客服和电话客服在内的多个服务渠道的各个行为阶段都存在着不少痛点问题。由于度假的产品涵盖酒店、机票和门票等多个方面,服务的多样性更加明显,给痛点问题的解决带来了更多的困难。

为了解决上述痛点问题,我们建立的智能云客服平台目标主要围绕以下六个方面进行改善:

1)服务流转效率;

2)服务响应时间;

3)标准化服务;

4)自动化服务;

5)违规管理;

6)流程优化;

当前的智能云客服平台已经在智能问答、服务渠道管理、服务流程优化和供应商管理四个方面上线了近80个模型,取得了很好的效果。

二、系统架构

下图展示了我们智能云客服平台的系统架构,其中在算法部分,我们设计并上线的自动纠错模型,使用户意图理解的准确率从60%提升到了90%以上;在工程部分,我们设计并构建了EasyAI平台,与很多AI平台往往提供给算法工程师使用不同,我们的EasyAI面向的是不熟悉技术的业务群体,通过这个平台,提升了业务50%的工作效率。

三、典型算法模型介绍

3.1 用户意图模型

用户在和客服聊天的时候,往往会有各种各样的意图,我们需要实时判断用户是否存在购买某一个具体产品的意图,或者是否能够形成一个明确的意图方便后续的产品推荐。我们采用了基于深度学习的多任务多标签的模型来实现,如果用户被判为存在上述意图,则会基于该意图,为用户提供更个性化的服务。

3.2 群监督模型

因为用户和客服的沟通都是基于群的方式来实现的,所以我们需要使用群监督模型来更好得对用户意图进行分析和判断。在真实情况下,用户的大部分聊天内容比较集中,样本量也非常大,而在某些意图上的样本量缺极度缺乏,为此我们构建了一个有效的群监督模型来解决样本极度不平衡的问题,该模型上线后,准确率从10%+提升到了80%+。

3.3 内容抽取模型

在智能云客服平台的诸多应用场景中都会使用到内容抽取功能,为此,我们构建了一个基于半监督学习的内容抽取通用模型。具体地,我们在常用的内容抽取模型的基础上加入自己建立的语言模型来实现半监督学习,最终准确率提升了7%。

3.4 知识图谱构建

在知识图谱的构建过程中,我们首先划分Domain,然后在每个Domain下去产生一个Schema。产生Schema的方式分为人工和自动两种,自动产生Schema的效果往往不是很理想,所以我们采用人工定义Schema的方式。

接下来我们在Schema的基础上实现信息的抽取,并进一步完成知识图谱的补全和融合。下图展示了我们从知识图谱的构建、抽取、补全、融合到推理过程中使用的所有模型。

3.5 自助问答模型

智能云客服平台的自助问答系统经历了从1.0到2.0的发展过程,在自助问答1.0系统中,我们建立粗粒度检索式模型来实现和用户的单轮对话。具体地,我们采用Bi-LSTM+Attention+CNN的方式来实现,分别对问题和回答建立模型,最后计算两个模型输出向量之间的相似度。

在自助问答2.0系统中,我们实现了机器和用户的多轮对话。对于用户的聊天内容,首先进行内容自动纠错和自然语言理解,然后进入对话管理,为了保证对话管理的性能,我们开发了核心组件。在对话管理之后,根据对用户意图和对话控制的理解,会选择检索式粗粒度回答和知识库细粒度回答两种方式。在获取所有的回答之后,我们会对其进行重新排序,同时,我们还会根据对用户意图的理解和当前用户所处的环节进行相应的推荐,最后生成最佳回答。下图展示了自助问答2.0系统的处理流程。

四、EasyAI平台介绍

在第二部分中,我们提到了EasyAI平台,这里我们做进一步的介绍。我们建立EasyAI平台的初衷是为了直接给业务进行操作。利用EasyAI平台,我们可以提高语料标注和模型训练的效率,实现标注语料的共享,同时也可以缩短建设周期,减少模型的重复建设。下图展示了我们EasyAI平台的系统架构。

写在最后

以上对携程度假智能云客服平台进行了介绍,但AI对于携程度假的价值远远不限于此,后续我们会进一步将知识图谱应用于智能推荐和搜索,同时也会实践旅游领域的机器阅读,减少知识图谱构建的费力度,最终实现服务全流程的自动化和智能化。

原文发布于微信公众号 - 携程技术中心(ctriptech)

原文发表时间:2018-01-04

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏ATYUN订阅号

语音识别技术里程碑:微软识别错误率降至5.1%

8月21日,微软宣布该公司的语音识别系统的错误率已经降至5.1%,这是目前为止错误率最低的,已经超过了去年由微软AI研究团队所创造的5.9%的成绩。 这两项研究...

40460
来自专栏灯塔大数据

TA是什么“鬼”?一个优秀数据科学家的主要构成特点

? 根据三位作者的咨询和研究经验,以及与许多大数据和分析主题的公司合作,了解一个良好的数据科学家具有哪些主要特征。 大数据分析已经满天都是,IBM项目,每天...

30590
来自专栏人工智能快报

专家探讨神经形态计算未来发展之路

多位国际电气和电子工程师协会(IEEE)会员联合发表了一篇神经形态计算与神经网络硬件的全面调研(调研得到了美国能源部先进科学计算研究办公室、橡树岭国家实验室的支...

33440
来自专栏ATYUN订阅号

进化计算将是人工智能未来发展的关键

AI可以说是2018年最大的科技话题。从Google Duplex的人为模仿,Spotify的歌曲推荐,到Uber的自驾车以及五角大楼使用 GoogleAI,该...

11030
来自专栏PPV课数据科学社区

编译 | 机器学习的趋势和人工智能的未来

数据飞轮,算法经济,和智能云托管的融合意味着每家公司现在可以是一个数据公司,每家公司现在可以访问算法智能,并且每一个应用程序可以是一个智能应用。 ? 每家公司现...

46590
来自专栏BestSDK

大数据解密用户画像,为何老用户利润贡献是新用户的16倍?

大家经常听到一个词,叫做“画像”,结合具体对象就是:“用户画像”、“商品画像”、“产品画像”、“资产画像”……特别是大数据时代下,在实际企业中,利用大数据进行“...

32850
来自专栏ATYUN订阅号

终于,谷歌发布了一种新量子处理器Bristlecone

AiTechYun 编辑:Yining 谷歌量子智能实验室(Google Quantum AI lab)的目标是建立一个量子计算机,用于解决现实世界的问题。谷歌...

30740
来自专栏机器学习算法与Python学习

微视频 | 人工智能会抢走我们的饭碗吗?

关键字全网搜索最新排名 【机器学习算法】:排名第一 【机器学习】:排名第二 【Python】:排名第三 【算法】:排名第四 ?

31080
来自专栏新智元

追踪报道:谷歌 TPU 处理器实现 4 大机器学习突破

【新智元导读】谷歌的论文《数据中心的 TPU 性能分析》(In-Datacenter Performance Analysis of a Tensor Proc...

34340
来自专栏CDA数据分析师

你觉得每次技术面试志在必得?数据可能要让你失望了。

原作者  Aline Lerner 编译 CDA 编译团队 本文为  CDA 数据分析师原创作品,转载需授权 前言 一般来说,当我们想到面试时,我们会想到当中有...

22460

扫码关注云+社区

领取腾讯云代金券