专栏首页wOw的Android小站[MachineLearning]tesseract使用

[MachineLearning]tesseract使用

tesseract 项目

google的一个开源OCR项目,详情读项目README吧。

https://github.com/tesseract-ocr/tesseract

安装方法

https://github.com/tesseract-ocr/tesseract/wiki/Compiling-%E2%80%93-GitInstallation

首先安装相关库

apt-get install autoconf-archive automake g++ libtool libleptonica-dev make pkg-config

然后运行

cd tesseract-ocr
./autogen.sh
./configure
make
sudo make install
sudo ldconfig

在configure过程会报错:

configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.

查看本地安装的Leptonica发现是1.73版本。查资料发现如下解释,1.74需要下载源码编译。

Tesseract versions and the minimum version of Leptonica required: Tesseract Leptonica Ubuntu 4.00 1.74.2 Must build from source 3.05 1.74.0 Must build from source 3.04 1.71 Ubuntu 16.04 <http://packages.ubuntu.com/xenial/libtesseract3> 3.03 1.70 Ubuntu 14.04 <http://packages.ubuntu.com/trusty/libtesseract3> 3.02 1.69 Ubuntu 12.04 <http://packages.ubuntu.com/precise/libtesseract3> 3.01 1.67

安装leptonica 1.74

wget http://www.leptonica.com/source/leptonica-1.74.4.tar.gz

tar xvf leptonica-1.74.tar.gz
cd leptonica-1.74

./configure
make
sudo make install

成功后继续执行tesseract的安装。

运行tesseract

tesseract digits1.png result -l chi_sim

命令参数:

  • digits1.png 要识别的图片文件
  • result 保存识别结果的文件
  • -l chi_sim 选择识别的文字类别,chi是中文

报错:

Error opening data file /usr/local/share//tessdata/chi_sim.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'chi_sim'
Tesseract couldn't load any languages!
Could not initialize tesseract.

需要设置data路径

export TESSDATA_PREFIX=/usr/local/share/tessdata/

然后从git@github.com:tesseract-ocr/tessdata.git 下载需要语言的data,中文就下载chi开头的文件。把data拷贝到TESSDATA_PREFIX路径下,再执行检测命令即可。

运行结果

0
电 话 18663778972
全 国 朝 号 2012127
&) H: 02 04 12 13 16 26

标 | 标标 _

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • [MarkDown] MarkDown语法小结

    HTML中 < 和 & 都要转码 但markdown不必,输入& 和 &amp; 都显示 &,< 也一样

    wOw
  • [Java] 使用EnumSet代替位运算简化代码逻辑

    然后代码逻辑里是大量的成员变量的判断,显得非常臃肿而且难读懂,大量的if-else判断让代码逻辑很脆弱,稍微一个情况没考虑好就会出现难以排查的bug。

    wOw
  • [设计模式]之五:职责链模式

    使多个对象都有机会处理请求,从而避免请求的发送者和接收者之间的耦合关系。将这个对象连成一条链,并沿着这条链传递该请求,直到有一个对象处理它为止。

    wOw
  • 收了!这100 个容器技术相关技能栈

    大规模的容器技术运用从来不是一项独立工程,而是一个汇集虚拟化技术、容器编排、任务调度、操作系统、容器仓库、跨节点网络、分布式存储、动态扩缩、负载均衡、日志监控、...

    用户6543014
  • 收集的网络上大型的开源图像处理软件代码(提供下载链接)

    要写好一个图像处理软件,仅靠自己看书是完全不够的,要多方面学习,借鉴前人的经验,要集思广益、多面出击。如今网络发达,图像学的资料其实也到处都是。只是...

    用户1138785
  • 推荐一个计算机视觉图书:python计算机视觉编程

    http://shop.oreilly.com/product/0636920022923.do

    流川疯
  • 基于opentracing + jaeger 实现全链路追踪

    当代互联网服务,通常都是用复杂,大规模分布式集群来实现,微服务化,这些软件模块分布在不同的机器,不同的数据中心,由不同团队,语言开发而成。因此,需要工具帮助理解...

    orientlu
  • 网站定位之---根据IP获得区域

    记得以前做一个培训机构网站时候需要定位,那时候用的搜狐的api,不是很精准。 后来做电商的时候用的新浪的api,感觉还行,,,,,当时就想要是有本地ip库多爽啊...

    逸鹏
  • python 字典(Dictionary) items()方法

    Python 字典(Dictionary) items() 函数以列表返回可遍历的(键, 值) 元组数组。

    于小勇
  • 2020 年最具潜力 44 个顶级开源项目,涵盖 11 类 AI 学习框架、平台(值得收藏)

    工欲善其事必先利其器,这也是大部分开发者在日常工作中最重要开发原则。选择与开发内容相匹配的工具,常常会使我们事半功倍。但面对人工智能的多个领域,如:机器学习、深...

    AI算法与图像处理

扫码关注云+社区

领取腾讯云代金券