前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >tesseract-ocr安装

tesseract-ocr安装

作者头像
jaychou
发布2022-12-26 14:49:12
8680
发布2022-12-26 14:49:12
举报
文章被收录于专栏:全栈开发笔记全栈开发笔记

Windows安装教程

依赖

Windows无需此操作

下载软件无脑下一步就完事了下载地址

yum 派系

依赖

控制台输入

yum install libpng-dev libtiff5-dev libwebp-dev libopenjp2-7-dev libgif-dev automake g++ git libtool libleptonica-dev make pkg-config

apt 派系

依赖

控制台输入

apt-get install libpng-dev libtiff5-dev libwebp-dev libopenjp2-7-dev libgif-dev automake g++ git libtool libleptonica-dev make pkg-config

安装 leptonica

git clone https://github.com/DanBloomberg/leptonica

cd leptonica
./autogen.sh
./configure
make
sudo make install

安装完成提示

tops xtractprotos '/usr/local/bin'
libtool: install: /usr/bin/install -c .libs/convertfilestopdf /usr/local/bin/convertfilestopdf
libtool: install: /usr/bin/install -c .libs/convertfilestops /usr/local/bin/convertfilestops
libtool: install: /usr/bin/install -c .libs/convertformat /usr/local/bin/convertformat
libtool: install: /usr/bin/install -c .libs/convertsegfilestopdf /usr/local/bin/convertsegfilestopdf
libtool: install: /usr/bin/install -c .libs/convertsegfilestops /usr/local/bin/convertsegfilestops
libtool: install: /usr/bin/install -c .libs/converttopdf /usr/local/bin/converttopdf
libtool: install: /usr/bin/install -c .libs/converttops /usr/local/bin/converttops
libtool: install: /usr/bin/install -c .libs/fileinfo /usr/local/bin/fileinfo
libtool: install: /usr/bin/install -c .libs/imagetops /usr/local/bin/imagetops
libtool: install: /usr/bin/install -c .libs/xtractprotos /usr/local/bin/xtractprotos

安装 tesseract-ocr-ocr

cd tesseract
./autogen.sh
./configure
make
sudo make install
sudo ldconfig

安装完成

输入 tesseract –version 出现一下提示即安装完成

➜  tesseract git:(master) ✗ tesseract --version
tesseract 5.0.0-alpha-859-gd13e
 leptonica-1.81.0
  libgif 5.1.4 : libjpeg 6b (libjpeg-turbo 1.5.2) : libpng 1.6.36 : libtiff 4.1.0 : zlib 1.2.11 : libwebp 0.6.1 : libopenjp2 2.3.0
 Found AVX2
 Found AVX
 Found SSE
 Found OpenMP 201511

安装字库

语言包地址:https://github.com/tesseract-ocr/tessdata

由于语言包比较大,这里我们之下英文,中文繁体,中文简体语言包

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata 
wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata

将语言包移动到tesseract目录下

检查是否安装成功,输入:tesseract –list-langs 出现一下提示视为安装成功

➜  tesseract git:(master) ✗ tesseract --list-langs
List of available languages (3):
chi_sim
chi_tra
eng

总结

三步走

第一步,安装相应依赖

第二部,下载源码编译&安装

第三部,安装语言包

最主要的就是依赖部分,可能各种因素使你的依赖不能下载完整,一定按顺序,此博客为踩坑后笔记,笔者按此次总结步骤以安装不下10遍,从本地=》研发=》测试=》预发=》灰度=》生产均无问题

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2021年9月5日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • Windows安装教程
    • 依赖
    • yum 派系
      • 依赖
      • apt 派系
        • 依赖
        • 安装 leptonica
        • 安装 tesseract-ocr-ocr
        • 安装字库
        • 总结
        相关产品与服务
        文字识别
        文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
        领券
        问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档