前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

作者头像
AI科技大本营
发布2020-03-17 15:20:26
3.8K0
发布2020-03-17 15:20:26
举报
整理 | AI科技大本营

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。

近期,这个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅17M。

目前,这个开源项目已在GitHub上标星2400+。

这个项目基于chineseocr与psenet实现中文自然场景文字检测及识别,环境是linux/macos。

以下为可实现的功能:

  • 提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)
  • 任意方向文字检测,识别时判断行文本方向
  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr 的)
  • 支持竖排文本识别
  • ncnn实现psenet(未实现核扩展)
  • ncnn实现crnn_dense(改变了全连接为conv1x1)
  • ncnn实现shuuflenev2角度分类网络
  • ncnn实现ocr整个流程

最近,项目作者对更新了可实现的功能。

  • nihui大佬实现的crnn_lstm推理
  • 升级crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高
  • 提供竖排文字样例以及字体库(旋转90度的字体)

字体样式

生成的竖排文本样例

识别效果展示:

ncnn检测识别展示(x86 cpu 单进程)

项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

【end】

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2020-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 AI科技大本营 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 生成的竖排文本样例
  • ncnn检测识别展示(x86 cpu 单进程)
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档