行业文档识别

最近更新时间:2019-08-26 18:34:28

产品介绍

行业文档识别(Document Optical Character Recognition,Document OCR)基于业内领先的深度学习技术,提供表单表格识别、体检报告识别、检验检查单识别、算式识别等多种行业文档识别服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于智能核保、智能理赔、试题批改等多种行业场景,大幅提升信息处理效率。

产品功能

表格识别

支持图片内表格文档的检测和识别,返回每个单元格的文字内容,支持将识别结果保存为 Excel 格式。

算式识别

支持作业算式题目的自动识别,目前覆盖K12学力范围内的14种题型,包括加减乘除四则运算、分数四则运算、竖式四则运算、脱式计算等。

产品优势

能力全面

支持保险、教育、金融、医疗等各类行业文档和表单表格的高精度识别服务,返回结构化信息,助力行业自动化效率提升。

算法领先

基于业内领先的深度学习算法、表格文字的识别准确率在92%以上,算式识别的准确率在94%以上。

鲁棒性强

适应多场景、任意背景,模糊、可容忍透视畸变、光照不均等实际应用中存在的复杂场景,并可实现自动裁边、修正倾斜等。

应用场景

智能核保和理赔

支持体验报告内容结构化提取,结合 NLP 技术,帮助保险公司实现核保流程的自动化。通过识别各类保单中的关键字段和医疗单据中的明细信息,加速完成保险理赔业务。

数学作业批改

通过一次简单的拍照就可以对算式、公式、试题等数学作业进行自动识别,结合结果智能批改功能,有效地提高了老师和家长检查和批改作业的工作效率。

物流单据电子化

实现各类物流表单的快速识别和结构化信息提取,帮助客户进行纸质表单的自动化录入,有效提升流程效率和录入信息准确度。