首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人工智能之Tessercat-OCR字符识别,无开发基础的也可以学会

要过年了,节前比较忙一直没有时间来发文章,今年忙里偷个闲,给大家讲一讲我最近在看的光学字符识别开源项目Tesseract-OCR。

Tessercat是一个开源的光学字符识别引擎也就是大家所说的ocr(Optical Character Recognition),Tessercat最早是HP公司的实验室开发的由google维护的,现在整个库已经支持了全球60多种语言文字,其中也包括中文。

tessercat依赖两个模块 模块 pil + tessercat-ocr

安装pil 命令行 pip install pillow

安装 tesseract-ocr 命令行 pip install pytessercat

安装完成后需将tessercat路径加入到系统的PATH中

再没有安装中文语言库时,我们可以测试些简单的数字如使用画图随便画一些数字或者屏幕截图一些数字

随便画一画

通过命令行找到Tessercat的安装目录,如果已将Tessercat安装路径加入到系统的PATH中可省去这步直接输入命令:

tessercat.py number.jpg result -l eng

命令完成后开发Tessercat的安装目录下面可以找到Tessercat自动新建的result.txt的文件,打开以后可以看到结果为0642316857,整个识别率还是很高的,想要提高识别率的话需要自己训练,生成自己需要的识别语言库。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180329A14RLZ00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券