产品简介
客服智能质检(intelligent quality assurance),是企点客服推出的AI驱动型客服质量检测系统,旨在帮助企业从海量的通话录音、对话文本中挖掘潜在的风险点和商机。依托语音识别(ASR)、自然语言处理(NLP)、大模型等技术,通过大模型质检规则与传统质检规则结合的方式,对全渠道客服对话(电话、在线聊天等)内容的合规监控、态度评估、业务解答准确性检查和舆情分析等,帮助企业全面提升服务质量、优化服务策略。


基本概念
概念 | 解释说明 |
常规质检规则 | 常规质检规则,利用关键词、正则表达式、文本相似度、响应时效、静音、插话抢话等传统检测能力对文本会话或录音进行质检。 质检规则,是根据实际业务制定的对客服服务内容考核方案。 一个规则,由一个或多个条件,通过一定的逻辑关系编排组成。 |
大模质检规则 | 自定义描述质检维度、命中条件等质检指令,大模型通过对会话上下文的语音理解,根据质检指令对会话进行质检。 在一些复杂场景中,如,投诉情绪识别、服务态度评估、多轮对话逻辑验证、客服专业性评估、风险评估等质检场景中,传统方法只能通过关键词、正则或文本相似度等检测,但整体准确率不到30%,利用大模型质检,整体准确率可达90%以上。 |
条件 | 条件是一个质检规则的基本组成部分,是对质检规则的内容的设置。 条件由算子和检查范围组成,例如:客服的第一句话包含 “很开心为您服务”这个条件的检查角色是客服,范围是客服说的第一句话,算子是出现关键字 “很开心为您服务”,一个条件只能包含一个算子。 |
算子 | 算子可理解为分析方式,如关键词、正则表达式、语义匹配、情绪检测等。 目前有以下类型的算子: 关键词匹配检测 正则表达式检测 语义标签检测 文本相似度检测 响应时效检测 通话静音检测 情绪能量检测 语速检测 插话抢话检测 |
检测范围 | 检查范围,即质检条件需要检测的范围限定。 由以下元素组成: 应用角色:当前条件用来检测哪个角色,可选值为所有角色/员工/客户 ,默认为员工。 前置条件:当其他的某个条件命中时,才会执行当前条件的检测,默认为无前置条件。 检测范围:指定检测对话中的哪些句子或全文检测。 |
质检 | 通过指定的质检规则,对客服和客户的对话音频文件/文本文件进行分析的过程,称为质检。 |
复核 | 机器质检完成后,人工对机器质检结果进行二次校验的成果成为复核。 |
命中 | 如果质检内容复核质检规则中设置的条件,则成为命中该质检规则。 |
数据集 | 本地上传的一个或多个音频文件的集合。 |
质检任务 | 质检任务,即指定质检规则,对筛选出的数据进行质检的过程。 质检任务分为数据集质检和客服质检。是指对产品或服务进行质量检查和评估的活动,以确保其符合规定的标准和要求。 |
产品特性
及时、全面、客观的质检服务
及时:实时质检,及时监控服务合规、客户投诉和舆情问题并告警止损。
全面:智能质检覆盖率100%,全面检测客服服务质量,提升客户体验。
客观:智能质检不受质检员主观意识影响,检测结果更客观、更准确。
开箱即用、质检准确率高
预置质检规则:预置丰富的质检规则,包括通用服务质检规则、金融行业质检规则、零售行业质检规则等;可满足70%以上的质检场景。
500+语义标签:预置丰富的质检标签,涉及客户、员工多种角色;金融、汽车、零售、消费电子、运营商等多种行业;表扬、投诉等多种情绪。
检测准确率高:内置丰富的质检算子能力,包括关键词检测、文本相似度检测、正则表达式检测、语义标签检测,检测准确率达到85%。
大模型加持、全栈AI驱动的智能化质检能力
大模型语音理解:基于千亿级参数的自研大模型或 DeepSeek 大模型,实现上下文关联推理、意图泛化识别及隐性情绪挖掘,复杂场景识别准确率达90%以上(传统能力不足30%)。
多模态分析引擎:支持语音(ASR)、文本(NLP)等多模态数据的融合分析,精准识别服务场景中的话术违规、情绪波动、流程断点等问题。
示例:电销场景中,同步分析坐席语音情绪(如不耐烦)与文本关键词(如虚假承诺),综合判定风险等级。
应用场景
客服智能质检可以有效应用在员工服务态度质检、员工敏感行为检测、员工 SOP 质检等多个场景,质检实时性达到秒级,检测并优化客服服务质量,及时发现和解决问题。
客服质量全量管控
替代人工抽检,100%覆盖所有对话,避免漏检违规行为(如辱骂客户、泄露隐私)。
示例:某电商发现20%客服未执行“结束语话术”,针对性加强培训。
客户体验优化
通过分析对话中的客户抱怨,定位产品、流程问题。
示例:某银行发现“账单导出咨询”占比超30%,推动优化 APP 说明页。
销售转化提升
分析高转化率会话的特征(如话术、响应速度),复制优秀客服经验。
示例:某教育机构通过分析 TOP10客服对话,提炼出“痛点挖掘-案例引导”标准化流程。
合规与风控
检测金融、医疗等强监管行业的合规话术(如风险提示、免责声明)。
示例:某保险企业实时拦截客服违规承诺“100%理赔”。
产品价值
语义理解深度升级,复杂场景质检准确率提升至90%以上
上下文关联分析
基于千亿级参数的大模型可精准捕捉多轮对话中的逻辑关联(如客户隐晦投诉、服务流程断点),传统模型仅能识别单句关键词。
示例:客户询问“你们和XX品牌比有什么优势?”后,客服未按标准对比话术回应,大模型可关联上下文判定“竞品应对缺失”风险。
意图泛化识别
对同一问题的多样化表达(如“怎么退款”“不想要了能退钱吗”)实现统一归类,准确率提升90%以上,减少规则库维护成本。
隐性情绪挖掘
通过分析文本语气词、修辞手法(如反讽“你们效率真高,一个月还没解决”),识别传统情感分析模型遗漏的客户负面情绪。
会话质检覆盖提升至100%:从“抽样盲区”到“全量洞察”核心价值
风险0漏检
传统人工抽检仅覆盖3%-5%的会话,大量违规话术(如金融销售误导、医疗隐私泄露)潜伏在未抽检样本中。全量质检可100%拦截风险事件,某保险企业上线后监管罚单减少82%。
示例:某银行通过全量质检发现0.3%的坐席私自承诺“保本理财”,及时整改避免重大合规危机。
长尾问题挖掘:
通过分析海量非抽检对话,识别低频但高损问题(如区域性方言导致的沟通误解),驱动服务标准细化,某电商企业借此将服务纠纷率降低37%。
数据资产完整性:
全量语料库为企业构建客户画像、优化产品设计提供底层支撑,某教培结构通过分析10万+会话,定位售后问题63%的客诉源于同一问题的规则不明。
传统质检能力与大模型质检能力对比
传统方法 VS 大模型方法


传统方法质检效果 VS 大模型质检效果
在一些复杂场景中,如,投诉情绪识别、服务态度评估、多轮对话逻辑验证、客服专业性评估、风险评估等质检场景中,传统方法只能通过关键词、正则或文本相似度等检测,但整体准确率不到30%,利用大模型质检,整体准确率可达90%以上。

