前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python识别文字,实现看图说话

Python识别文字,实现看图说话

作者头像
代码医生工作室
发布2019-10-23 20:12:45
2.6K0
发布2019-10-23 20:12:45
举报
文章被收录于专栏:相约机器人相约机器人

现在写文件很多网站都不让复制了,所以每次都是截图然后发到QQ上然后用手机QQ的文字识别再发回电脑。感觉有点小麻烦了,所以想自己写一个小软件方便方便自己,就有了这篇了:

首先语言是Python,要实现的功能主要为文字识别,所以需要调用OCR技术,要做到够方便,所以需要调用系统剪切板,还需要一个小窗口,使用的是pyqt5。

OCR是直接使用的Tesseract-OCR,具体使用可以去搜一下,网上有很多,这里给出下载地址:

Tesseract exe 下载地址:

https://digi.bib.uni-mannheim.de/tesseract/

训练data 下载地址:

https://github.com/tesseract-ocr/tessdata (chi_sim是简体中文)

识别方法为:

代码语言:javascript
复制
pytesseract.image_to_string(now_image, lang='chi_sim')

调用剪切板用的是:

代码语言:javascript
复制
clipboard = QApplication.clipboard()
##取出剪切板的图片
clipboard.pixmap().save('cut_img.jpg')

##文字存入剪切板
clipboard.setText(str

整体代码很简单,我就不上了,附上软件地址:

64和32版本:

链接:

https://pan.baidu.com/s/129cgx5-hcLFiLhhaCIgHlQ&shfl=sharepset

提取码:2425

单32位版本(在64位系统下也能运行,记得添加信任):

链接:

https://pan.baidu.com/s/1JiRBXzG2glr445VoXI1BXA&shfl=sharepset

提取码:l08b

或者:

链接:https://download.csdn.net/download/qq_21189053/11878342

打包之后不知道为啥64位的200多M,32位只有30M。

由于调用了系统的剪切板,所以可能会被安全软件隔离,解压后添加信任区,并右键以管理员运行。

请放心使用,保证无毒!

附上使用截图:

解压后根据个人系统位数运行:

然后直接微信或QQ截图,可以将缩放比调大一点,准确一些:

然后不用保存,直接点击识别:

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-10-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 相约机器人 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档