Python提取图片中的文字信息,腾讯内部技术,一行代码搞定!

用过手机QQ就知道,点击一个图片会弹出一个小功能,那就是提取图片中的文字。非常方便实用,那么很难实现吗?

利用Python提取图片中的文字信息,只需要一行代码就能搞定!

当然,这是吹牛皮的,但是真正的Python代码也就第4行,说是一行代码搞定也没错。

示例:

效果

尽管运行Python代码后也有几个错误的地方,但是大部分是识别正确的。

你以为就这样结束了吗?那这么简单,我都不用出教程了。一行代码实现这个功能当然也是要有前戏的。

一,pytesseract和PIL的安装

pip安装

2,pycharm编辑器能够快速安装,这就看你是否用pycharm了。

pycharm的Settings设置页按照下面步骤操作

安装好了pytesseract,安装PIL在上面第三步里搜索PIL并点击安装就可以了。

安装好了所有库,运行下面Python代码

出现报错

可以看到提示:未安装识别引擎tesseract-ocr

二,安装识别引擎tesseract-ocr

1.网上下载安装包,然后直接点击安装即可

因为tesseract-ocr默认不支持中文识别,所以解压安装tesseract-ocr后还需做如下操作

2,安装完成tesseract-ocr后,我们还需配置好

打开后做如下操作

当然也能由pycharm快速打开pytesseract.py

第一步:

第二步:

第三步:

现在已经完成了所有配置,运行下面Python代码即可实现图片里的文字提取

本文到此就结束了,希望各位Python越学越好,早日达成梦想。

  • 发表于:
  • 原文链接:https://kuaibao.qq.com/s/20180709A10K4L00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券