好久没有进行一些相关的更新的了,去年一共更新了四篇,最近一直在做音视频相关的直播服务,又是重新学习积攒经验的一个过程。去年疫情也比较严重,等到解封,又一直很忙,最近又算有了一些时间,所以想着可以做一些更新了,又拿起了 OpenCV,做一些相关更新了。其实代码相关的工作,在上一篇 OpenCV-摄像头相关的完成之后已经做完了,只是一直没有写相关博客,这次先给做完。
文本检测与文本识别都是基于原生OpenCV的扩张模块来实现的,基本流程是按照 OpenCV 文字检测与识别模块来实现的,只不过是我做了一些关于Ot与OpenCV的集成工作做成了项目。大致工作流程为:图片选择,功能选择,图片保存。
相关的文档我在内外网搜索后发现大致几篇一样的文档,来源不可考,大致都贴出来:
OpenCV 文字檢測與識別模塊 - 台部落 / OpenCV 文字检测与识别模块 - CSDN
OPENCV 文字检测与识别模块 - 灰信网
文档基本相同,CSDN与灰信网完全相同,台部落是资源路径不同,台部落是原始模型资源路径,CSDN与灰信网的路径相同是一个网盘。但是台部落与CSDN博主是同一个名字。那就是灰信网。
编译相关的已经在前两篇文档已经描述过了,路径如下: OpenCv4.4.0+Qt5.12.2+OpenCv-Contrib-4.4.0。
那就描述一下本期需要用到的一些资源:
资源文件描述如下: textDetector.hpp 文档中 37-39行。详细内容如下:
textbox.prototxt - 本地文档模块目录中,按照路径查找即可。
TextBoxes_icdar13.caffemodel - TextBoxes_icdar13.caffemodel
所需要的资源如下:见相关网页描述: OpenCV.org, text_recognition_cnn.cpp,不过也只是贴出了相关路径而已,原始博客中提到的关于
相关路径已经失效。
vgg_text,是一些快照文件,只有两个比较小的文件资源,模型module已经是没有的了。最后还是使用CSDN博主的资源,利用百度网盘下载了,折磨人。
其他涉及到资源文件,基本都在模块的文件路径下:
路径如下:
其他的一些图片资源也可以在当前目录下找到。
MainWindow类是主要的Ctrl模块,其他两个类 ParallelExtracCSER,ParallelOCR属于业务类了,主要功能模块实现相关的。
主要对应四个主要功能,图片导入,图片保存,文本检测,文本识别
做了一个图片显示,附带缩放显示
基本流程如上,相关的函数解释与释义都已经附上,更详细的说明解释,见上述博客内容,就不再做一边赘述了。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。