专栏首页arxiv.org翻译专栏基于线路的OCR的CRNNs精度:多参数评价(CS)
原创

基于线路的OCR的CRNNs精度:多参数评价(CS)

译文:

本文研究如何在降解纸上为难以辨别的历史字体来训练出高质量的光学字符识别(OCR)模型。通过广泛的网格搜索,我们获得了神经网络架构和一组最佳的数据增强设置。我们讨论了诸如二元化、输入线高度、网络宽度、网络深度以及其他网络训练参数如随机失活等因素的影响。将这些发现应用到实际模型中,我们仅从 10000 行培训数据中就能获得 0.44% 的字符错误率 (CER) 模型,其性能优于目前可用的经过预先训练的模型,这些模型的训练量是数据量的 20 倍以上。我们展示了培训流程中所有组件的消融,它们都依赖于开源框架 Calamari。

原文题目: On the Accuracy of CRNNs for Line-Based OCR: A Multi-Parameter Evaluation(CS)

原文:

We investigate how to train a high quality optical character recognition (OCR) model for difficult historical typefaces on degraded paper. Through extensive grid searches, we obtain a neural network architecture and a set of optimal data augmentation settings. We discuss the influence of factors such as binarization, input line height, network width, network depth, and other network training parameters such as dropout. Implementing these findings into a practical model, we are able to obtain a 0.44% character error rate (CER) model from only 10,000 lines of training data, outperforming currently available pretrained models that were trained on more than 20 times the amount of data. We show ablations for all components of our training pipeline, which relies on the open source framework Calamari.

原文作者:

Bernhard Liebl, Manuel Burghardt

原文地址:

https://arxiv.org/abs/2008.02777

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 正则表达式模式匹配和成员资格的细粒度复杂性(CS)

    目前最快的正则表达式模式匹配和成员算法将经典 O(nm) 时间算法提高了约 log=3/2\n 倍。我们不关注一般模式而是分析此工作中边界深度的均匀模式。对于他...

    孙孙孙
  • 学习对城市进行因素化和重新照明(CS)

    我们提出了一个基于学习的框架,将室外场景分为随时间变化的照明和永久场景因素。受经典内在图像分解的启发,我们的学习信号基于两个见解:1) 组合分离的因子可以重建原...

    孙孙孙
  • 应用于人工智能学习价值的动态模型(CS)

    人工智能 (AI) 开发专家预测,智能系统和代理开发的进步将重塑我们社会的重要领域。然而,如果不谨慎、批判、反省地取得这样的进步,可能会给人类带来负面的结果。因...

    孙孙孙
  • 记一次数据库的分析和优化建议(r6笔记第24天)

    数据库的巡检是DBA工作中的一部分,有时候我们还是希望能够在巡检的基础上发现一些潜在的问题,把尽可能多的问题解决在初始阶段。 今天来给大家举一个数据库巡检和性能...

    jeanron100
  • [剑指offer][Java]不用加减乘除做加法

    链接:https://www.nowcoder.com/questionTerminal/59ac416b4b944300b617d4f7f111b215 ...

    后端技术漫谈
  • 剑指offer 不用加减乘除做加法

    首先看十进制是如何做的: 5+7=12,三步走  第一步:相加各位的值,不算进位,得到2。  第二步:计算进位值,得到10. 如果这一步的进位值为0,那么第...

    week
  • SAP CRM WebClient UI和CRM Fiori应用里Opportunity的显示过滤逻辑

    版权声明:本文为博主汪子熙原创文章,未经博主允许不得转载。 https://jerry.bl...

    Jerry Wang
  • 聊聊AWK命令的那些事

    对于下面的nginx日志access.log,用脚本分析出访问ip的Top 10。 其实这个题不难,但是考察了几个常用的shell 命令,awk、uniq、so...

    大数据技术与应用实战
  • python 字典实现三级菜单

       2.开始显示所有的省份,输入要进入的省份之后,显示该省份下的所有市,输入市显示该市下的所有县

    py3study
  • 2017年10个人工智能失败的例子

    今年,人工智能项目AlphaGo和Libratus分别在围棋和扑克上完胜世界上最好的人类玩家。尽管这些里程碑显示了近几年人工智能取得的巨大进步,但许多人对新兴技...

    人工智能的秘密

扫码关注云+社区

领取腾讯云代金券