前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python使用tesseract-ocr完成验证码识别

python使用tesseract-ocr完成验证码识别

原创
作者头像
transcai
修改2021-01-26 20:55:12
2.1K0
修改2021-01-26 20:55:12
举报
文章被收录于专栏:transcaitranscai

一、python验证码识别库安装


Ubuntu版本:

1.tesseract-ocr安装

sudo apt-get install tesseract-oc

2.pytesseract安装

sudo pip install pytesseract

3.Pillow 安装

sudo pip install pillow


其他linux版本(如centos):

1.tesseract-ocr安装

没找到直接命令安装,所以需要手动下载安装包。

https://github.com/tesseract-ocr/tesseract

在上述地址中下载最新的tesseract-ocr的安装包,并解压。

通过以下命令安装:

(1)cd tesseract-3.04.01

(2)./autogen.sh

(3)./configure

注意,如果出现**error: leptonica not found**,需要下载安装**leptonica**

http://www.leptonica.org/download.html

(4)make

(5)make install

(6)ldconfig

2.pytesseract安装

sudo pip install pytesseract

3.Pillow 安装

sudo pip install pillow


windows版本:

1.tesseract-ocr安装

http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe

下载,并安装。

注意:如果是64位的用户,在安装的时需要改变安装目录,如下图所示:

这里写图片描述
这里写图片描述

2.pytesseract安装

pip install pytesseract

3.Pillow 安装

pip install pillow


mac版本:

1.tesseract-ocr安装

brew install tesseract-oc

注意:如果未安装brew命令,可以输入命令:

brew官网:http://brew.sh

/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

2.pytesseract安装

sudo pip install pytesseract

3.Pillow 安装

sudo pip install pillow

二、Python验证码识别代码


代码语言:txt
复制
import pytesseract

from PIL import Image



image = Image.open('code.png')

code = pytesseract.image\_to\_string(image)

print code

三、pytesseract运行错误:


1.pytesseract.pytesseract.TesseractError: (1,'Error opening data file /usr/local/share/tessdata/eng.traineddata')

解决方法:(原文地址http://stackoverflow.com/questions/14800730/tesseract-running-error)

(1)$ wget https://tesseract-ocr.googlecode.com/files/eng.traineddata.gz

(2)$ gunzip eng.traineddata.gz

(3)$ sudo mv -v eng.traineddata /usr/local/share/tessdata/

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、python验证码识别库安装
    • Ubuntu版本:
      • 其他linux版本(如centos):
        • windows版本:
          • 注意:如果是64位的用户,在安装的时需要改变安装目录,如下图所示:
            • mac版本:
              • 注意:如果未安装brew命令,可以输入命令:
              • 二、Python验证码识别代码
              • 三、pytesseract运行错误:
                • 1.pytesseract.pytesseract.TesseractError: (1,'Error opening data file /usr/local/share/tessdata/eng.traineddata')
                相关产品与服务
                AI 应用产品
                文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
                领券
                问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档