linux上部署tess4j项目
在windows上项目是可以正常运行的,部署到Linux上后,运行报异常,异常内容为:Unable to load library ‘tesseract’: Native library (linux-x86-64/libtesseract)
这个报错的原因就是项目无法加载库资源文件 libtesseract(在linux上是.so文件,windows是.dll文件)
解决:
在资源文件win32-x86那一层添加linux-x86-64/所需的so文件
1.将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下,问题解决,nice
2.可能是eng语言包有问题,正确的包文件如下:
记录一下在Linux上部署tesseract
( 所需要的 Linux 安装包 tesseract-ocr-3.02.02.tar.gz及安装需要的leptonica-1.68.tar.gz 英文语言包 tesseract-ocr-3.02.eng.tar.gz 戳链接:戳我)
1,编译环境: gcc gcc-c++ make(这个环境一般机器都具备,可以忽略) yum install gcc gcc-c++ make
2,autoconf automake libtool libjpeg-devel libpng-devel libtiff-devel zlib-devel 可以通过yum安装:
(1)yum install autoconf automake libtool
(2)yum install libjpeg-devel libpng-devel libtiff-devel zlib-devel
3,安装 leptonica
下载 leptonica-1.68.tar.gz
tar-zxvf leptonica-1.68.tar.gz (1) 进入 leptonica-1.73文件夹内(cd 命令) (2) 执行下面command
./configure
make
make install
ldconfig
4,安装 tesseract
下载 tesseract-ocr-3.02.02.tar.gz (1) 进入 tesseract-ocr-3.02.02文件夹内(cd 命令) (2) 执行下面command
./autogen.sh
./configure
make
make install
ldconfig
如果需要在linux上运行带tess4j的项目,需要将/usr/local/lib下相关的tesseract和leptonica的library(.so)的文件复制到 /usr/lib下
5,安装语言包
下载 tesseract-ocr-3.02.eng.tar.gz (如果需要验证中文,就下载中文的语言包)
tar -zxvf tesseract-ocr-3.02.eng.tar.gz
解压后将 tesseract-ocr/tessdata 下的所有文件全部拷贝到 /usr/local/share/tessdata 下。 ,如果没有tessdata文件夹,就去tesseract的安装文件位置将目录下的tessdata拷贝到 /usr/local/share/
6,执行命令
tesseract
如果出现下图,就安装成功了
7,到这,你就可以敲下面的代码验证图片中的文字了:
命令: tesseract 图片名 输出文本名 -l eng