前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >OCR产业应用实战,多类别电表读数识别方案详解

OCR产业应用实战,多类别电表读数识别方案详解

作者头像
用户1386409
发布2022-03-31 15:43:37
7400
发布2022-03-31 15:43:37
举报
文章被收录于专栏:PaddlePaddlePaddlePaddle

我国电力行业发展迅速,电表作为测电设备经历了普通电表、预付费电表和智能电表三个阶段的发展。在产业场景中,表的种类多达十几种,过去依赖人工抄表,成本很高。如果能够采集到大量电表图片,借助人工智能技术批量检测和识别,将会大幅提升效率。

本次飞桨产业实践范例库开源电表读数识别场景应用,提供了从数据准备、技术方案、模型训练优化,到模型部署的全流程可复用方案,降低产业落地门槛。

⭐项目链接⭐

https://github.com/PaddlePaddle/awesome-DeepLearning

所有源码及教程均已开源,欢迎大家使用,star鼓励~

基于深度学习技术

实现电表读数识别

本场景要解决多类别电表识别任务,从技术上需要对多种类别的电表表数和表号进行检测再识别,从数据到模型面临着多重问题。

项目难点:

  • 在数据方面,电表种类多、数据少、拍摄角度多样且部分数据反光严重。
  • 如何从零标注电表数据,选择何种标注软件能够最快速度构建数据集?
  • 技术路线的选择也面临多方面的问题,例如是通过文字检测来反向微调,还是通过目标检测从零训练?

本项目将一一解决这些难点。

项目方案:

基于上述难点,飞桨开发者技术专家不断进行尝试,最终选用了飞桨文字识别套件PaddleOCR中的PP-OCR模型进行了微调与优化,其检测部分基于DB的分割方法实现,直接解决了电表数据中的倾斜问题,通过再造数据集来扩充识别数据集,训练识别模型。PP-OCR模型经过大量实验,其泛化性也足以支撑复杂垂类场景下的效果。

在数据标注工具上,使用PPOCRLabel实现半自动标注,内嵌PP-OCR模型,一键实现机器自动标注,且具有便捷的修改体验。支持四点框、矩形框标注模式,导出格式可直接用于PaddleOCR训练,标注效率显著提升。

方案优化:

在优化方面,首先对PP-OCR模型的检测部分进行初步微调,然后通过对数据的进一步分析,发现原始图像分辨率较大,进而调整EastRandomCropData的尺寸,放大输入模型前的图像尺度。通过CopyPaste数据增强解决数据量小的问题,并且根据实际情况调小学习率。

项目效果:

最终在评测数据集上从原先的Hmeans=0.3优化到0.85。除此之外,本项目也尝试了一部分目标检测算法。具体的优化过程和详细解释,欢迎大家关注直播!

微调前后对比

部署方面使用飞桨原生推理库Paddle Inference完成,满足用户批量预测、数据安全性高、延迟低的需求,快速在本地完成部署方案。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2022-02-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 PaddlePaddle 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档