Tesseract -v
——显示出tesseract的版本号则表示安装,及环境变量配置成功。否则根据提示检查安装失败原因
Tesseract的环境变量的设置:
Tesseract工具没有可视化的界面使用,只能在命令行中使用。
用下面命令将图片转成txt文档:
——Tesseract 图片路径 结果文件名 -l 语言(语言英文为eng,简体中文为chi_sim)
与tesseract配套使用的是它的训练工具,需要安装java的jre。
训练工具的使用步骤如下:
rename inttemp normal.inttemp
rename pffmtable normal.pffmtable
rename shapetable normal.shapetable
11.生成zlc.traineddata文件combine_tessdata zlc.
12.将上一步生成的zlc.traineddata文件放入tessdata文件夹下面。
使用总结:使用自己训练的字库仍然准确不不高,该工具是根据明暗程度分辨字迹的。也有可能是我还未摸索到更好的使用方法。分享本篇文章是为了记录我摸索该工具的过程,也希望大家有更好的使用方法也可以评论出来。我们一起交流。
本文分享自 暴走的软件测试Tester 微信公众号,前往查看
如有侵权,请联系 cloudcommunity@tencent.com 删除。
本文参与 腾讯云自媒体同步曝光计划 ,欢迎热爱写作的你一起参与!