专栏首页python3python3 for win10X64

python3 for win10X64

其实也不算自己写的,在网上东找找西找找,合一块问题就解决了。

和谐社会的程序猿不都这样么。。

上正菜。

先安装pillow

windows 10上面先打开命令提示符:

注:不知道为啥我装python 3.5的时候蛋疼的选择了管理员安装,所以运行命令提示符的话也需要管理员权限。怎么操作就不说了。

1. 安装Pillow

2. 安装pytesseract

3. 再安装tesseract-ocr,注意这个很关系是文字识别的核心程序。

报错了,看来前面太顺了,python看不过去了。

至于报错的信息:error: Microsoft Visual C++ 14.0 is required. Get it with "Microsoft Visual C++ Build Tools": http://landinghub.visualstudio.com/visual-cpp-build-tools

让我去这个网站装   Microsoft Visual C++ 14.0相关的东东,N N D 我打开网站,下载之后安装,看所需要的空间 4GB。玩不起,还是算了,我是菜鸟,太多的东西不懂,所以不要为难我。

所以找其它方法装tesseract-ocr

这里面有tesseract-ocr for windows的安装方法。安装步骤我们强大的度娘就有:

http://jingyan.baidu.com/article/219f4bf788addfde442d38fe.html

安装时要什么字库自己选。

懒人连接:https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-4.00.00dev.exe

MAC  LINUX  WINDOWS 各版本下载

https://github.com/tesseract-ocr/tesseract/wiki

相关的程序基本安装完了。

开始做一个小程序参考图如下:

我是在pycharm中练习的,代码如下:

from PIL import Image
import pytesseract
img = Image.open()
text = pytesseract.p_w_picpath_to_string(img)
print (text)

注:我把上面的参考图命名为22.png了,因为我太2了

装好几个程序了,看看效果运行:

"C:\Program Files\Python35\python.exe" D:/Python_Study3.5/test/pli_png.py
Traceback (most recent call last):
  File "D:/Python_Study3.5/test/pli_png.py", line 4, in <module>
    text = pytesseract.p_w_picpath_to_string(img)
  File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 122, in p_w_picpath_to_string
    config=config)
  File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 46, in run_tesseract
    proc = subprocess.Popen(command, stderr=subprocess.PIPE)
  File "C:\Program Files\Python35\lib\subprocess.py", line 676, in __init__
    restore_signals, start_new_session)
  File "C:\Program Files\Python35\lib\subprocess.py", line 957, in _execute_child
    startupinfo)
FileNotFoundError: [WinError 2] 系统找不到指定的文件。

M D 找不到指定文件,到这里我也不懂,继续百度。然后找到的文章说要更改 pytesseract.py这个文件的一些配置(第二个安装的模块)。因为这里面配置有一些相关于tesseract-ocr(即第三个安装的程序)

更改如下:

在pycharm中如图打开pytesseract.py:

在右边打开的窗口找到:tesseract_cmd 这行代码:

这一行注释掉:因为pytesseract.py文件内默认的tesseract-ocr的主程序环境变量不知道怎么变的,到了windows 下面就不能运行,上面执行的报错代码中找不到文件,其实就是找不到主程序。所以注释掉原来的,我们再新加一行。上面的路径就是你安装Tesseract-ocr程序时的路径:

#tesseract_cmd = 'tesseract'

新增加一行:

tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

保存,运行我们写的代码,看看效果。

又报错了,伤不起

"C:\Program Files\Python35\python.exe" D:/Python_Study3.5/test/pli_png.py
Traceback (most recent call last):
  File "D:/Python_Study3.5/test/pli_png.py", line 4, in <module>
    text = pytesseract.p_w_picpath_to_string(img)
  File "C:\Program Files\Python35\lib\site-packages\pytesseract\pytesseract.py", line 125, in p_w_picpath_to_string
    raise TesseractError(status, errors)
pytesseract.pytesseract.TesseractError: (1, 'Error opening data file \\Program Files (x86)\\
Tesseract-OCR\\eng.traineddata')
Process finished with exit code 1

这次报的错,貌似是找不到tesseract-ocr的配置文件。看来还得改pytesseract.py文件。

于是又从网上找了一些东西,继续更改。

如图

保存,接着运行程序:

啥啥成功了,虽然识别多了一个小数点,不过至少不报错了。

就试到这里了,多的我也不会。

以上大部分内容都是来自网上。我不过做下整理。

那里说错了,莫怪,我了解的也不多。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • h3c 更新IOS方法

    1.local-user ftp     进入FTP用户设置模式 2.service-type ftp   设置登陆FTP服务器的用户名,这里就是FTP 3...

    用户2398817
  • python文件命名的错误

    D:\>python3 re.py Input a email addr: someone@gmail.com Traceback (most recent c...

    用户2398817
  • python模块fileinput

    用户2398817
  • Redis总结

    爱撒谎的男孩
  • 跨域 - jsonp轻松搞定跨域请求

    1.jsonp轻松搞定跨域请求 vue中使用axios,遇到跨域我就蒙逼了。第一次真正意义上的尝试使用jsonp js中用

    xing.org1^
  • 塔秘 | 最受欢迎的编程难题网站列表汇总

    前言 编程几乎已经成为了人类所知每个行业的必要组成部分,如今有越来越多的人开始了他们的编程之旅。 ? 本文列举了一些非常受欢迎的编程难题网站列表,并且做了简单介...

    灯塔大数据
  • Python Flask模块

    模块是一个包含响应文本的文件,其中包含占用位变量表示的动态部分,其具体值只在请求的上下文中才知道。使用真实值替换变量,再返回最终得到的响应字符串,这一过程称为渲...

    用户1173509
  • 有哪些好的刷题网站?2017年最受欢迎的编程挑战网站

    编程几乎已经成为了人类所知每个行业的必要组成部分,如今有越来越多的人开始了他们的编程之旅。 ? 如果你正在在学习编程,那么我可以告诉你一个提高技能的好方法,那就...

    企鹅号小编
  • 程序媛的人生观

    昨天是周四,周四是发版日。因为周五有其他的会,我们组决定周四辛苦一点,开会将项目验收和两个技术方案评审都做了。验收项验收的是我晚上要发版的系统。

    静儿
  • HP拆分背后的动机 加速并购和联手寻找失落的企业级市场

    这个悠长的假期终于结束了,T哥也回归了正常的轨道,多日不写稿件发现不仅手生蔬了不少,连业内最重大新闻也错过了,其中HP将个人级与企业级分拆成两个公司的新闻被广为...

    人称T客

扫码关注云+社区

领取腾讯云代金券

玩转腾讯云 有奖征文活动