前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >开源OCR文本检测器,基于TextBoxes++和RetinaNet

开源OCR文本检测器,基于TextBoxes++和RetinaNet

作者头像
代码医生工作室
发布2019-11-18 17:59:54
1.6K0
发布2019-11-18 17:59:54
举报
文章被收录于专栏:相约机器人

【导读】OCR由文本定位和文本识别组件构成。本文介绍Github上的一个开源文本定位组件Text_Detector,它使用了RetinaNet的结构和textboxes++中的一些技术。

OCR由文本定位和文本识别组件构成,文本定位组件寻找文本所在的位置,文本识别组件识别每个字符。本文介绍一个开源文本位置探测器Text_Detector,它的Github地址为:

https://github.com/qjadud1994/Text_Detector

Text_Detector使用了RetinaNet和textboxes++中的一些技术:

  • RetinaNet: https://arxiv.org/pdf/1708.02002.pdf
  • textboxes++: https://arxiv.org/pdf/1801.02765.pdf

Text_Detector的Github页给出了一些较好的识别结果和较差的识别结果。

较好的识别结果如下:

在一些垂直文本或长文本等情况下,Text_Detector的效果不太理想:

Text_Detector依赖的环境如下:

  • 操作系统 : Ubuntu 16.04.4 LTS
  • GPU : Tesla P40 (24GB)
  • Python : 3.6.6
  • Tensorflow : 1.10.0
  • Pytorch : 0.4.1
  • tensorboardX : 1.2
  • CUDA, CUDNN : 9.0, 7.1.3

更多关于Text_Detector的细节可以在它的Github主页上找到。

参考链接:

  • https://github.com/qjadud1994/Text_Detector
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-11-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 相约机器人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档