90行代码搞定文字识别!

最近因为有文字识别的需求,刚好有看见百度云提供了免费的文字识别接口,所以就用python写了一下,现在写下来记录一下。

要写文字识别需要安装python环境和集成开发环境,还需要稍微了解一下python。

Python3 安装教程:

http://www.runoob.com/python3/python3-install.html

Pycharm 安装教程:

http://www.runoob.com/w3cnote/pycharm-windows-install.html

Python 入门:

https://www.cnblogs.com/wupeiqi/articles/4906230.html

这些都弄好了之后,你还需要用百度账号去百度云申请一个接口使用权。获得APP_ID,API_KEY和SECRET_KEY。

写代码之前,先要想一想过程,文字识别分为几个过程,首先选择文件,然后上传文件到百度云,再然后从百度云下载文件,再然后将文件写入到本地。最后要这个软件能够提供普通用户使用还要写一下图形界面。

之所以能够90行代码写完文字识别,python丰富的库功不可没,这里用到了下面这些库。

首先就是要先设计一下程序运行出来是什么样子,我大概设计成这样 ↓↓↓

第一行提示用户选择文字识别还是表格识别

第二行提示用户已经选择了哪个文件

第三行显示两个按钮,一个是文件选择按钮,一个是转换按钮。

确定了大致形状后,开始写代码。

最后的成果如下 ↓↓↓

写完了图形界面以后,就要开始写具体的功能了,这里主要包括三部分功能,即选择文件,上传,下载文件以及将文件保存到本地。

选择文件没什么好说的,调用一个库函数就搞定了。

具体代码如下:

文件写入部分也很容易,将文字识别结果写到txt文件,表格识别保存成xls格式,我默认将他们保存在照片同一文件夹内,统一命名。

最后总共代码90行(不算注释),识别效率也还行,和一般的软件差不多。其实这个东西挺容易的,也挺鸡肋的,手机都这么发达了,谁会用电脑识别呢。

最后附上全部代码:

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181209G0CFWI00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。

扫码关注云+社区

领取腾讯云代金券