首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

供电局客服语音主题模型实践

项目背景

电力行业作为服务行业之一,聆听用户的需求和反馈的电力客服部门十分重要。在大数据时代,“数据即财富”的理念被市场广泛追逐。

其中,电话语音数据是企业在经营活动中客户与企业交互产生的信息资源,包含着客户需求、喜好、投诉建议等有竞争价值的信息,大量的客服语音数据亟需通过大数据寻找其真正的价值。

项目需求

通过机器学习方法对电力行业客服语音转文本数据建立主题分析模型,从而将客户在反馈和咨询过程中遇到的问题归类,并且挖掘出以往在人工分类经验里被忽略的新的主题。

工单数据经由语音翻译转文本,共有429514条语音记录。

主题模型

主题模型(Topic Model)在机器学习和自然语言处理等领域是用来在一系列文档中发现抽象主题的一种统计模型。直观来讲,如果一篇文章有一个中心思想,那么一些特定词语会更频繁的出现。

比方说,如果一篇文章是在讲狗的,那“狗”和“骨头”等词出现的频率会高些。如果一篇文章是在讲猫的,那“猫”和“鱼”等词出现的频率会高些。而有些词例如“这个”、“和”大概在两篇文章中出现的频率会大致相等。

但真实的情况是,一篇文章通常包含多种主题,而且每个主题所占比例各不相同。因此,如果一篇文章10%和猫有关,90%和狗有关,那么和狗相关的关键字出现的次数大概会是和猫相关的关键字出现次数的9倍。一个主题模型试图用数学框架来体现文档的这种特点。

主题模型自动分析每个文档,统计文档内的词语,根据统计的信息来断定当前文档含有哪些主题,以及每个主题所占的比例各为多少。

实现过程

结果分析

★在主题模型分析中,最终一共提炼了21个主题。在传统的人工经验分类中,仅有5%的工单可以确定主题,而我们通过机器主题聚类,可以达到81.5%工单主题匹配率。

★通过分析潜在投诉倾向的用户工单,提取出谈到比较多的关键词,方便后续的统计分析。

★面对多达几十万的工单数据,传统的人工不仅要耗费巨大的人力成本,而且实现效果也很粗糙。通过模型预测快速查出该工单对应的问题是哪些分类,同时挖掘出新的主题,更加明确用户的反馈和需求,精准找到用户痛点,为企业创造出巨大价值。

机器主题模型的分布情况

广州迪奥信息科技有限公司创立于2012年,是中国领先的数据技术服务提供商,通过大数据模型与AI算法,为客户提供设备故障预测、人工智能应用、智能客服、生产优化模型,透过数据洞察事实与趋势,提高业务优化能力,凭借多年积累的实践经验,公司业务涵盖智能客服,智能运检,智能档案质检等领域。

了解迪奥科技更多服务

了解更多大数据知识

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20190124G17A3V00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券