首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >文字识别助力智能运营,加速金融业务流转效率

文字识别助力智能运营,加速金融业务流转效率

作者头像
崔庆才
发布2022-09-20 15:20:18
1.2K0
发布2022-09-20 15:20:18
举报
文章被收录于专栏:进击的Coder进击的Coder

背景

智慧金融在金融服务的业务流程中不断深入,金融行业数字化建设的过程除了面向外部客户的服务与销售外,行业内部的支持性系统也在随之升级。智能合规、智能运营广泛应用于企业内部财务管理系统、报销系统、核算系统以及审核系统等平台中,促使数据沉淀,加速流程效率,实现数字化建设闭环。

在智能运营覆盖的各个场景中,计算机视觉、自然语言处理、传统机器学习算法等人工智能技术充分应用。其中文字识别技术(OCR)作为计算机视觉的主要方向之一,其识别对象包括扫描合同、印章、卡证、表格与票据信息结构化,在业务办理、风险控制、内部数据库建设与信息支撑等场景中都扮演着重要角色。

图 智能运营中的 OCR 应用

场景问题

在这些场景中,图片数据一方面通过对纸质文档和票据的扫描来获取,另一方面包含对证件拍照的方式获取。面临的场景难点和技术难点同时存在:

  • 印章识别场景中的文字遮挡、模糊、弯曲程度高,印章类型多;
  • 扫描文档文字密集,检测漏检与识别精度对后续关键信息提取系统影响大;
  • 拍摄卡证图片时的透视变换、过曝过暗、有色阴影等问题;
  • 表格种类繁多,差异性大,缺乏开源数据,无标注工具;
  • 基于图像处理和规则的表格识别难度大,通用性差;
  • 弯曲文本的端到端算法的精度问题与两阶段算法的速度问题需要权衡。

图 表格识别中数据种类的多样性

解决方法

良好的算法模型是解决上述问题的首要因素,这不仅要求算法模型对于某个类型的对象的识别精度能够满足业务需求,还要其拥有良好的泛化能力。飞桨文字识别开发套件 PaddleOCR 针对自然场景下的 OCR 任务提供面向产业级的超轻量通用 OCR 系统 PP-OCRv3,经过海量数据训练,达到产业级 SOTA,在工业制造、交通等行业中得到广泛验证。针对文档场景提供智能文档分析系统 PP-Structurev2,实现表格识别、关键信息提取、版面分析与恢复任务。

图 PP-OCRv3 应用效果

图 PP-Structurev2 文档分析流程图

场景应用

场景 1:印章弯曲文本检测与识别

印章检测识别是定位合同文件和常用票据中印章位置,提取识别印章内容的任务。可以用于检测合同文件和票据中是否有印章,对比印章内容,验证是否有业务风险。实际业务中通过人工审核对比的方式成本高,效率低。为了降本增效,提高生产效率,基于 PaddleDetection 和 PaddleOCR 开发套件,实现印章检测以及印章文字识别任务,代替人工识别,降低成本,辅助印章比对验证业务,提高验证效率,降低财税及商务合同签订过程的业务风险。

图 印章文本检测与识别

场景 2:扫描版合同关键信息抽取

合同审核广泛应用于大中型企业、上市公司、证券、基金公司中,是规避风险的重要任务。实际业务中人工进行纸质版合同审核成本高,工作量大。针对以上场景 PaddleOCR+PaddleNLP 可以快速提取文本内容,经过少量数据微调即可准确抽取关键信息,高效完成合同内容对比、合规性检查、风险点识别等任务,提高效率,降低风险。

图 扫描版合同关键信息抽取

场景 3:通用卡证结构化信息提取

卡证识别的应用遍布于银行、保险、证券、信托等各种金融机构,在业务办理和信息核验场景中需要识别身份证、银行卡、驾驶证、营业执照等。由于数据的采集来源多样,存在各种噪声,如图片方向混乱、反光、模糊、倾斜问题的干扰,且一般需要对卡证信息进行结构化输出。针对上述问题,基于 PaddleClas 与 PaddleOCR 完成卡证方向与类型分类,多方案卡证检测对比与识别,最终 H-Means 达到 93% 以上。

图 通用卡证结构化信息提取

场景 4:中文表格识别与属性分析

中文表格识别在保险理赔、财报分析和信息录入等场景应用颇多,实际业务中人工进行录入成本高,同时,开源中文表格数据集少也限制了中文表格识别模型的发展。针对以上情况,通过采用数据标注、数据合成和微调等场景适配方法,同时结合表格属性识别,快速完成中文表格识别任务。

图 中文表格识别与属性分析

更多内容

PaddleOCR 除了提供产业级特色模型 PP-OCR 与 PP-Structure 以外,打通从数据合成标注、模型训练到推理部署的应用全流程。提供 22 种训练部署方式,半自动标注工具 PPOCRLabel,《动手学 OCR》电子书以及丰富的场景应用和前沿算法,通过全流程的开发体验助力产业界快速落地 OCR 应用。

图PaddleOCR全景图

课程预告及入群福利

为进一步加速金融科技行业人工智能融合创新与产业落地,百度飞桨联合百度智能云举办主题为“乘风而起,AI赋能智慧金融创新发展”的行业经验系列分享课程,包含 4 周系统课程,4 大主流场景,10+ 代码全开源的实践范例,邀请行业内专家共同探讨科技金融的未来发展,分享产业实践。

9 月 15 日(周四)和 9 月 20 日(周二)将由百度研发工程师联合外部合作伙伴带来金融行业智能运营主题课程分享,名额有限,感兴趣的朋友可扫码预约课程:

扫码报名直播课,加入技术交流群

更多精彩抢先看

更多内容可参考以下链接:

飞桨官网:https://www.paddlepaddle.org.cn

PaddleOCR项目地址:

Github:https://github.com/PaddlePaddle/PaddleOCR

Gitee:https://gitee.com/PaddlePaddle/PaddleOCR

附:“乘风而起,AI赋能智慧金融创新发展”系列课程海报(如已在前文扫码入群,则报名成功,无需重复操作)

注:上述图片均来源于网络

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2022-09-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 进击的Coder 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档