前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >tess4j linux so文件,linux上安装tess4j项目「建议收藏」

tess4j linux so文件,linux上安装tess4j项目「建议收藏」

作者头像
全栈程序员站长
发布2022-06-27 11:08:04
1.8K0
发布2022-06-27 11:08:04
举报
文章被收录于专栏:全栈程序员必看

大家好,又见面了,我是你们的朋友全栈君。

本文主要介绍了linux上安装tess4j项目,通过具体的解释说明,让我们从中学到linux上安装tess4j项目的精髓所在,让我们对Linux内部原理越来越熟悉,希望大家能够在以后的学习中更加快速的弄明白其中的关键。便于更好的操作。

linux tesseract 安装及部署tess4j项目会遇到一些的问题,总结如下:

在windows上项目是可以正常运行的,部署到Linux上后,运行报异常,异常内容为:Unable to load library ‘tesseract’: Native library (linux-x86-64/libtesseract)

这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件,windows是.dll文件)

解决:

将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下,问题解决,nice

记录一下在Linux上部署tesseract

( 所需要的 Linux 安装包 tesseract-ocr-3.02.02.tar.gz及安装需要的leptonica-1.68.tar.gz 英文语言包 eng.traineddata.gz 戳链接:戳我)

1,编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略)

yum install gcc gcc-c++ make

2,autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:

(1)yum install autoconf automake libtool

(2)yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel

3,安装 leptonica

下载 leptonica-1.68.tar.gz

tar-zxvf leptonica-1.68.tar.gz

(1) 进入 leptonica-1.73文件夹内(cd 命令)

(2) 执行下面command

./configure

make

make install

ldconfig

//—————————————————————–

make的时候发现错误,提示

pngio.c:119: error: ‘Z_DEFAULT_COMPRESSION’ undeclared here (not in a function)

去wiki上搜了一把发现是 pngio.c这个文件有个BUG,在MAC下无法找到zlib1g包修改Leptionica/src/pngio.c在 #include “png.h”后插入一下代码即可。

1 #ifdef HAVE_LIBZ 2 #include “zlib.h” 3 #endif

//—————————————————————–

4,安装 tesseract

下载 tesseract-ocr-3.02.02.tar.gz

(1) 进入 tesseract-ocr-3.02.02文件夹内(cd 命令)

(2) 执行下面command

./autogen.sh

./configure

make

make install

ldconfig

如果需要在linux上运行带tess4j的项目,需要将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下

5,安装语言包

下载 eng.traineddata.gz (如果需要验证中文,就下载中文的语言包)

tar -zxvf eng.traineddata.gz

将 eng.traineddata文件 拷贝到 /usr/local/share/tessdata下 ,如果没有tessdata文件夹,就去tesseract的安装文件位置将目录下的tessdata拷贝到 /usr/local/share/

6,执行命令 tesseract

如果出现下图,就安装成功了

7,到这,你就可以敲下面的代码验证图片中的文字了:

命令: tesseract 图片名 输出文本名 -l eng

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/133241.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022年6月9,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档