将被自然语言处理和文字分析颠覆的行业:法律,保险和客服

简介

不论是那些从事前沿研究开发,强化自然语言处理能力的人,还是那些在各自行业中越发认为自然语言处理能够为他们带来竞争力的机构和创新者,现在投身到自然语言处理(NLP)中都绝对是令人兴奋的。

到2021年,全球自然语言处理市场的价值预计会达到160亿美元,所以科技巨头们争相斥巨资投入到自然语言处理中以求分得一块蛋糕就不足为奇了。在过去5年中,超过30家从事人工智能前沿研究的私有企业被谷歌,雅虎,英特尔,苹果和Salesforce等巨头们争相并购。

涉足自然语言处理,文本分析和文本挖掘并不只是大公司的专利。小公司、初创公司,甚至业余项目都变得越来越容易涉足这些技术。

自然语言处理技术正在帮助公司规模化地将大量的非结构化数据物尽其用,同时能够给他们提供一些见解和分析,而这些,在几年前,他们做梦也想不到会成为现实。

现在我们将依次了解下最容易被人工智能和自然语言处理颠覆的三个行业:

1 法律业 2 保险业 3 客户服务

◆ ◆

法律业中的自然语言处理和文本分析

尽管我们离机器人律师还有很长一段路要走,现在具有创新意识的法律专业人士已经开始利用自然语言处理、文本挖掘和文本分析技术来发现经常隐藏在大量数据中的关键点,或者看起来不相关,但经过规模化分析后有价值的关键点,以及发现战略增长和经常性的案件变化的趋势,从而帮助他们在更快的时间内做出更明智的决策。

我们来介绍两个例子,看看法律专业人士是如何利用自然语言处理和文本分析技术的。

  • 电子数据展示(ediscovery)中的信息检索
  • 合同管理
  • 条款摘要
  • 电子数据展示中的信息检索

电子数据展示表示在信息类型是电子版的法律诉讼过程中发现查找数据,例如起诉,政府调查,信息自由法请求等过程。电子版文件经常搭配难以在纸质版文件中发现的元数据,例如文件纪录、分享的日期和时间等。像这种分钟级别的细节在法律诉讼过程中很重要。

就自然语言处理而言,电子数据展示主要是关于信息检索,帮助法律团队寻找相关和有用的文件。

在很多案件中,需要分析的数据量能超过100GB,经常只有5%到10%是真正相关的。要想筛选和减少数据量,外包服务机构每处理1GB数据要收费1千美元,你能看到成本会以多快的速度飞涨。

通过提取特定主体(人,地点,金额等)来涵盖或剔除特定时间表,在电子邮件线程中只收录包含公司、人和被告的邮件,数据可以被筛选和分离。

◆ ◆

合同管理

自然语言处理使得合同管理部门能够提取诸如金额和日期等关键信息,去总结合同中的条款来形成报告,还可以出于风险评估,预算和计划的目的去比较所有条款。

在知识产权相关的争端案件中,律师正在利用自然语言处理和文本挖掘技术从专利和公共法庭记录等原文件中提取关键信息,去帮助他们指明案件中的方向。

条款摘要

众所周知,法律文件如果要完整地阅读会又长又沉闷。有时其实只需要一个对全部文本的概括,来帮助法律人士理解全部内容。利用自然语言处理技术总结这些文件是可能的,我们可以从内容主体中选定固定数量的句子来生成一个摘要,例如提取最能反映文件内容的5个句子形成一个摘要。

NLP和文本分析在保险业的应用

保险从业者每天会从不同的渠道收集大量的数据,例如网站、在线聊天、电子邮件、社交网络、经纪人或客户代表手中。这些数据不仅来源于不同渠道,更与许多的方面都有关系,例如主张、抱怨、政策、健康报告、事故报告、客户和潜在客户在社交媒体上的互动、电子邮件、在线聊天、电话……这个列表可以很长很长。

折磨保险业最大的问题就是骗保。让我们来看看NLP、数据挖掘和文本分析技术是如何帮助保险业从业者来解决这些关键因素的。

将数据流精简导向正确的部门/代理 通过反馈及时准确的数据来改善代理的决策 改善SLA响应时间和整体的客户体验 协助检测骗保的声明和活动

◆ ◆

精简数据流

海量的数据和信息每天都会汇集到保险公司,并且需要被精密地管理、储存、分析并及时地表现出来。一封错过的邮件或者便笺或许不仅会导致糟糕的服务,让客户变得沮丧,更有可能会给公司带来财物损失,例如,当在一个争端案件中,相关证据没能及时传送到正确的人或部门手上时。

自然语言处理(NLP)通过一系列自动生成并分组的请求和文档,用于帮助保险业从业者确保在正确的时间将正确的数据能传到正确的“眼睛”中。这已经远远超过了文本分析技术用于理解文本并归类的简单的关键词匹配。

◆ ◆

欺诈检测

《欧洲保险》最近的一份报告显示,在欧洲,检测和未检测到的骗保理赔估计占了全部理赔的10%。在这里需要注意的当然是那些没有被检测到的欺诈。

保险公司通过NLP和文本分析技术来从非结构化的资源中挖掘数据,例如申请、理赔表格和调停通知,从而发掘出已提交的理赔申请中高危的部分。比如说,一个典型的骗保指标就是多份理赔申请中的事故的常见描述词汇。一个受过训练的人眼或许不一定真的无法察觉这些情况,但是这需要大量耗费时间的练习并且容易受到检测者主观性的影响,效果也并不稳定。

保险业从业者的解决方案是发展NLP分析面板来支持快速决策分析,高亮潜在的骗保行为并使他们的调查员能够基于一定的KPI来对不同的案件做优先级上的排序。

◆ ◆

NLP,文本分析和客户服务

在一个越来越多关注SLA、KPI和ROI的世界里,客户支持和客户的成功对于一个科技公司来说再重要不过了。在不断增长的初创公司和创新公司杀入大量领域的现状下,客户体验成为了市场洪流中消费者选择的一个关键性因素

让我们来看看NLP和文本分析在改善用户体验方面能四个选择

  • 聊天机器人
  • 分析客户/客服交互
  • 情感分析
  • 客户提问自动回复

聊天机器人

现在可以很肯定的说聊天机器人是一个非常棒的东西了!这些聊天客服开始出现在各处,因为公司期望利用前沿的人工智能技术来武装自己。

你甚至有可能意识不到这一点,那就是你的日常偏好会被多个机器客服记录下来。网店通过他们来向我们推荐商品,回答我们的问题,生成个性化的路径并作为虚拟助手来和我们交流。

一个我最近和个人助理机器人Amy的交互案例

聊天机器人正在带来更多个性化的体验。当其被正确利用时,不仅可以减少公司成本,因为人力的需求减少了,同样在客户体验上增加了巨大的价值,因为有这样智能、定向性强和全天候服务的存在。

分析客户/客服交互

客服和客户之间的交互行为可以发现有趣的,可行动的见解和趋势。许多交互是以文本的形式默认存在的,如邮件、在线聊天、反馈表等,而声音到文本的转换技术可以用于将电话交流转换成文本以供分析。

倾听顾客

顾客的声音在如今变得比过去更加重要。社交媒体就像是一个等待发掘的消费者意见的公共金矿。NLP和文本分析可以让你分析海量的社交聊天记录来帮助理解人们对一个具体的项目、产品、品牌甚至公司的态度。

通过分析对你的品牌的态度可以帮助你降低流失并改善客户支持,通过发现并主动改进负面趋势的方式。这也可以在造成太大损失之前发现问题并悬崖勒马,同时在你做了正确的事情时得到及时反馈并保持下去

当客户反馈包含了大量的负面情感时,反馈给产品发展团队可以帮助他们更有效地指导他们的努力方向。

由于客户支持的多渠道性,你更倾向于搜集不同渠道的信息来源:邮件、社交媒体、反馈表、在线聊天等。对许多公司来说,回应速度是一个关键绩效。与此同时,如何将客户的询问通过最短的步骤导向相关部门也是至关重要的一环。

NLP可以在没有人工参与的情况下用于自动导向和分类客户需求。如前所述,这不仅仅是简单的关键词匹配,而是运用文本分析技术来真正“理解”内容并分类

◆ ◆

总结

随着非结构化数据的不断增长,如何收集、分析并体现数据的价值变得更加重要。无论是哪个行业的运营,公司都需要关注NLP和文本分析带来的好处,这会使他们在市场份额的战役中取得足够的先机。

原文链接:http://blog.aylien.com/nlp-text-analysis-insurance-legal-customer-service

原文发布于微信公众号 - 大数据文摘(BigDataDigest)

原文发表时间:2016-10-21

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏PPV课数据科学社区

【经典】你用 Python 做过什么有趣的数据挖掘项目?

编者按:本文经授权转载自知乎回答,作者何明科系一面网络技术有限公司创始人。作者现身说法,用自己的创业历程举例说明:有钱很重要,有趣更重要。以下是正文:enjoy...

43040
来自专栏程序员互动联盟

有哪些编程语言会在未来20年内消失?

编程语言据不完全统计全球已经有500多种,真正进入大众视线的也就几十种,真正用的多的不超过十种,而且排名还时刻在动,有一点是确认的任何编程语言都有存在的必要性,...

14710
来自专栏灯塔大数据

PK BAT,运营商大数据其实更有价值

要谈起大数据,必然要提到BAT等互联网公司,它们在大数据领域是先发者,不过这也很正常,因为它本身是有数据基因的,其天然的在线性,其血液中流淌着BIT的血,并通过...

40180
来自专栏机器人网

解密推动机器人产业发展的八大技术

5亿年前,地球迎来了物种的大爆发,即“寒武纪生命大爆炸”。在相关的研究中,有一派的观点非常激进,他们提出:视觉的进化增强了物种捕猎及交配的能力,是造成寒武纪生命...

33270
来自专栏CDA数据分析师

译文 | 给CIO管理业务的5个智能数据建议!

本文由CDA数据分析研究院翻译,译者:王晨光,转载必须获得本站、原作者、译者的同意,拒绝任何不表明译者及来源的转载! 无论是第一天还是第501天,对于CIO(C...

18660
来自专栏腾讯大讲堂的专栏

你现在的焦虑,可能真的不是因为没钱

18430
来自专栏产品成长日志

从[低水平勤奋]到[爆发式成长]的高效策略

上学时不清楚为何学习,随着大流,摸索着方法,完成一次次考试,磕磕绊绊,完成了研究生学业,但是依然不知道学习到底有什么用。

9310
来自专栏开源项目

从退学到创业,90 后程序员为啥这么爱折腾?

17330
来自专栏数据猿

投稿 | 达观数据CEO陈运文:大数据挖掘技术在企业创新中的应用

<数据猿导读> 随着互联网时代的大发展,数据记录逐步脱离了纸笔的限制,与此同时,数据的概念也在进一步拓宽。大数据时代涌现出了大量新型数据的、非结构化的数据,对这...

36260
来自专栏智能计算时代

谁负责物联网安全?

事物互联(IoT)正在爆发成为主流,即使移动应用程序在企业中的广泛作用也在扩大。但是对移动和物联网安全性的担忧正在迅速发展。 简而言之,挑战在于,在物联网和移动...

29690

扫码关注云+社区

领取腾讯云代金券