深度学习可以全方位取代OCR识别吗?

这些年深度学习的出现,让光学字符识别(OCR)技术焕发第二春。现在光学字符识别(OCR)基本都用卷积神经网络来做了,而且识别率也是惊人的好,人们也不再需要花大量时间去设计字符特征了。

在光学字符识别(OCR)系统中,人工神经网络主要充当特征提取器和分类器的功能,输入是字符图像,输出是识别结果,一气呵成。当然用深度学习做光学字符识别(OCR)并不是在每个方面都很优秀,因为神经网络的训练需要大量的训练数据,那么如果我们没有办法得到大量训练数据时,这种方法很可能就不奏效了。其次,神经网络的训练需要花费大量的时间,并且需要用到的硬件资源一般都比较多,这几个都是需要考虑的问题。

在一些简单环境下光学字符识别(OCR)的准确度已经比较高了(比如电子文档),但是在一些复杂环境下的字符识别,在当今还没有人敢说自己能做的很好。现在大家都很少会把目光还放在如何对电子文档的文字识别该怎么进一步提高准确率了,因为他们把目光放在更有挑战性的领域。光学字符识别(OCR)传统方法在应对复杂图文场景的文字识别显得力不从心,越来越多人把精力都放在研究如何把文字在复杂场景读出来,并且读得准确作为研究课题,用学界术语来说,就是场景文本识别(文字检测+文字识别)。

1) 建立中文资料库 要大量输入各种文书、刊、报及文件,使用光学字符识别(OCR)可以缩短建库时间,减轻劳动强度,降低费用。

2) 办公自动化 工厂企业、公司及事业单位的日常办公用文件及资料等需要输入计算机存储检索。使用光学字符识别(OCR),既比存储图像文件大大地节省存储量,又不需要专职录入人员,是减轻劳动量、节约资金、提高办公效率的最好措施。

3) 机器翻译机器翻译的第一步是将全文输入计算机。利用光学字符识别(OCR)可以将机器自动翻译相匹配,实现高速自动翻译。

4) 图书馆、文献中心 用本系统自动录入图书有关信息,可建立书目数据库自动录入经典图书全文,将纸上文字转移到计算机内,便于保存、查找、检索,更大的好处可以提供给专家用计算机对书籍内容进行研究。

5) 打字公司、书刊出版社、报社等 使用光学字符识别(OCR)可以自动录入已经出版的文章和打印文件,稍加修改编辑成新文章或再版己有书刊。光学字符识别(OCR)输出的标准汉字代码文件可为大多数中文处理系统、轻印刷系统、照排系统所接受,可重新打印、印刷输出。

6) 个人使用 当您阅读资料时,可用光学字符识别(OCR)将您感兴趣的段落自动录入。特别是作家,利用本软件可以将一些书载历史资料或文献快速录入到计算机内。

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20200221A0JATM00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券