专栏首页探索RPARPA之眼:AI-OCR,Fax-OCR概述

RPA之眼:AI-OCR,Fax-OCR概述

文丨马磊

OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。

OCR是英文“Optical Character Recognition/Reader”的简称,光学字符识别。从名字我们不难看出,OCR就是读取手写和印刷文字,并把读取的信息转换成可以在电脑的Excel,World等软件上使用的文字信息处理技术。

 当前的信息化社会,大量的文件被电子化,纸质的文件越来越少。但事实上依然存在很多不得不使用纸质文件的情况,比如说街头调查问卷。OCR技术的诞生可以取代人工读取纸质文件的工作,并将纸质文件的信息电子化。

RPA和OCR的协作

RPA目前活跃在以金融机关代表的企业中,但是这些企业的纸质媒体和打印数据等非电子化的数据仅仅依靠RPA来进行业务处理的话还是相当困难的。这就为RPA技术与OCR技术的协同合作提供了契机。

在只有RPA的情况下,需要员工手动把纸质文件的信息录入到Excel,Word等电子文档中,然后运行RPA机器人读取电子文档中的信息实现业务的自动化处理。

而RPA + OCR的情况下,只需实现扫描好纸质文件,OCR会自动读取扫描文件,将图片信息读取并写入Excel等文档中,然后RPA机器人运行,进行业务处理。这个过程完全替代了人工手动录入,极大地节约了人力成本。

RPA和OCR的协作

近年来, OCR引起了广泛关注,但目前的OCR软件存在精度不高和无法应对非固定文件模板等课题。未来通过在OCR中引入AI的深度机器学习等技术以后,相信一定会解决这个课题。

Fax-OCR是什么?

Fax-OCR

Fax-OCR是把传真机接收的订单等纸质文件通过OCR技术自动转为文本信息的技术。虽说现在社会尤其是国内公司,很多都是网上接单了,但是用传真接收客户订单这种古老的方式还是在一定程度上存在的。尤其是日本的小型公司依然采用这种老旧的接收订单的方式。如果把传真资料自动读入系统将减少大量人工录入的费时操作,同时人工失误也会大幅减少。

OCR的注意点

OCR技术确实可以自动实现数据的文本化,也是一项非常有效的效率改善的技术手段,但是现在的阶段OCR并非无所不能。

1、无法对应多份文件。

一般来说,OCR 需要读取文本内容以及文件内容的模板,并定义好抽出的对象数据的位置。但是,由于客户的文件模板并不统一,文件模板和数据坐标位置也不尽相同,这种情况应对起来就比较困难了。所以对于一些既有模板以外的文件要格外注意。

2、文字数据抽出后,必须进行人工确认。

虽然AI-OCR可以通过机器学习技术去识别手写文字,但是很多不清楚,或者写法不鲜明的文字还是很难做到完美识别。因此,数据抽出完毕后还是要通过人去确认数据的正确性。

原文链接:https://www.uibot.com.cn/news-7-1307.html

我来说两句

0 条评论
登录 后参与评论

相关文章

  • RPA搭载OCR,拓展机器人流程自动化应用范围

    在多数组织的智能自动化流程业务中,OCR(光学字符识别)是目前应用最多的人工智能技术之一。OCR与RPA的结合可以将组织中超过70%的无纸化业务实现自动化,其效...

    蕉黄
  • RPA机器人有效解决低效能业务流程升级难点

    企业的数字化、自动化转型是一个综合命题,RPA也绝非是低效套用的通用模板,在决策各个阶段的关键要点都需要量体裁衣、细致考量。

    蕉黄
  • 金融RPA+AI如何成长为一种新业态?

    金融业如今正在经历着一场前所未有的科技变革,AI(人工智能)、RPA(机器人流程自动化)等前沿技术正在重塑未来的金融业。而RPA+AI在金融科技领域里的创新指数...

    蕉黄
  • 新闻动态 | 国内首份OCR白皮书正式发布:腾讯优图公布OCR技术全新发展趋势

    9月28日,在工业和信息化部、北京市人民政府、国际电信联盟ITU-T指导的2020 AIIA人工智能开发者大会上,主办方正式发布国内首份OCR白皮书。白皮书从O...

    优图实验室
  • Oracle RAC OCR 与健忘症

        OCR就好比Windows的一个注册表,存储了所有与集群,RAC数据库相关的配置信息。而且是公用的配置,也就是说多个节点共享相同的配置信息。因此该配置应...

    Leshami
  • 利用机器视觉OCR提升包装生产线性能的三种方法

    OCR 是什么? OCR,或光学字符识别,是一种广泛应用于包装业的视觉系统工具。与条形码技术一样,OCR 也是一种数据采集的方法。它的最大优势在于其信息代码格式...

    机器人网
  • Java开发的几个注意点

    比如,没有把一些需要并发执行时使用的线程数设置成可在属性文件中配置。那么你的程序无论在DEV环境中,还是TEST环境中,都可以顺畅无阻地运行,但是一旦部署在PR...

    哲洛不闹
  • Java开发的几个注意点

    将一些需要变动的配置写在属性文件中 比如,没有把一些需要并发执行时使用的线程数设置成可在属性文件中配置。那么你的程序无论在DEV环境中,还是TEST环境中,都可...

    企鹅号小编
  • 12大要点让你的Java开发所向披靡~

    比如,没有把一些需要并发执行时使用的线程数设置成可在属性文件中配置。那么你的程序无论在DEV环境中,还是TEST环境中,都可以顺畅无阻地运行,但是一旦部署在PR...

    lyb-geek
  • 最大熵的Java实现

    这是一个最大熵的简明Java实现,提供训练与预测接口。训练采用GIS训练算法,附带示例训练集。本文旨在介绍最大熵的原理、分类和实现,不涉及公式推导或其他训练算法...

    用户3003813

扫码关注云+社区

领取腾讯云代金券