前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >四行Python代码,你也能从图片上识别文字!

四行Python代码,你也能从图片上识别文字!

作者头像
我被狗咬了
发布2019-09-23 10:18:03
2.2K0
发布2019-09-23 10:18:03
举报
文章被收录于专栏:Python乱炖Python乱炖

图像识别、文字识别,这些都是现在比较火的东西,现在大部分的AI都有在做这些东西,那我们就过来了解一下吧!

只需要四行代码,完成从图片中读取图片中的文字!

准备工作:

我们需要两个安装包,先来安装一下:

pip install pillow

pip install pytesseract

安装完之后,我们需要下载Tesseract-OCR这个软件,这里我已经将东西都打包好了放在百度云中,大家可以直接下载:

链接

https://pan.baidu.com/s/1osNf95ScZJYhtzsGFLtxaA

密码

npmn

打开安装包,一路next

记录好自己的安装路径

安装完之后找到tessdata目录下,将下载的chi_sim.traineddata文件放到该目录下。这样它就能识别中文了。

之后,我们只剩下一个东西要配一下了,在pytesseract模块中pytesseract.py文件中去配置一下Tesseract-OCR的工作目录,这个时候我们可以通过刚刚pip安装的位置找到pytesseract.py文件,如下图:

进入目录找到pytesseract.py文件并且打开它:

将tesseract_cmd这个变量的值改成Tesseract-OCR的安装目录即可。

现在,我们在准备一张图片,用来识别,小编就用微信截图好了,放置在桌面文件夹上:

开始代码:

到这里,我们所有的预备环境以及全部搭建好了,下面我们就开始来敲代码咯:

from PIL import Image

import pytesseract

pic_content=pytesseract.image_to_string(Image.open('C:\\Users\\yuqing.wu\\Desktop\\all\\3.png'),lang='chi_sim')

print(pic_content)

我们来看看运行结果:

结果还是比较准的。

大家也来试试吧!

像这样的图像识别还是挺重要、挺常用的,例如图片验证码等等,都是可以去完成的,就看大家怎么去用了!

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2018-08-30,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python乱炖 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档