OCR Demo路径如下,然后选择打开OCR项目:
一般直接运行可能会出错,因为需要下载eng.traineddata语言包,可以识别数字和字母,注意一下下载地址和保存路径,国内的网很容易下载失败,所以导致运行出错。
https://github.com/tesseract-ocr/tessdata/blob/590567f20dc044f6948a8e2c61afc714c360ad0e/eng.traineddata?raw=true
默认情况程序会先绘制Hello World的文字,然后识别,效果如下:
我这边用画图工具随手写了文字,可以使用Load Image加载图像识别:
如果你想识别中文,可以下载简体中文语言包chi_sim.traineddata,修改代码中语言包初始化部分:
识别效果可能不太好,你可以根据自己的实际情况训练字符集,然后用EmguCV来加载测试,训练方法参考tesseract github
https://github.com/tesseract-ocr/tesseract
我这边把最新的语言包下载好了,大家可以直接下载,使用时注意路径。
链接:https://pan.baidu.com/s/1dYhhlr1HJyr-IsEj1lrYUA
提取码:qk43
本文分享自 OpenCV与AI深度学习 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!