文字识别小项目-调用百度api文字识别,并将结果存入txt文件

OCR小项目:调用百度api文字识别,并将结果存入txt文件

百度API: http://ai.baidu.com/tech/ocr

百度提供了文字识别的api可以利用它来做文字识别啦,要不要尝试一下,很简单哦

注意:免费使用次数有限哦

代码:

import os
import os.path
import sys
from aip import AipOcr
APP_ID = '10498120'
API_KEY = 'hwwISLbyb1en11SsjDyEu7tW'
SECRET_KEY = 'waOoWyci9GDlRw1CkWNtmfkHRNokwhca'
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 读取图片,返回路径的集合
def file_name(file_dir):
 pathSet = []
 FN = []
 for root, dirs, files in os.walk(file_dir):
 for file in files:
 FN.append(file)
 pathSet.append(os.path.join(root, file))
 return pathSet

# 打开文件 读取文件内容
def get_file_content(filePath):
 with open(filePath, 'rb') as fp:
 return fp.read()

# 返回文件的类型符号,如:最后.jpg
def file_extension(path):
 return os.path.splitext(path)[1]

file_dir = 'E:images_new'
pathSet = file_name(file_dir)
result = []

for filePath in pathSet:
 # 调用通用文字识别接口
 if (file_extension(filePath) == '.jpg'):
 result = client.basicGeneral(get_file_content(filePath))
 # {'log_id': 6775584000925260612, 'words_result_num': 1, 'words_result': [{'words': '20'}]}
 if 'words_result' in result:
 rest = result['words_result'][0]['words']
 else:
 break
 f = open('E:\images_new\result.txt', 'a', encoding='utf-8')
 f.write('
'+'/images_new/' + os.path.basename(filePath) + ' ' + rest)
 f.close()

# 如果图片是url 调用示例如下
#result = client.basicGeneral('http://www.xxxxxx.com/img.jpg')

原文发布于微信公众号 - AI深度学习求索(AIDeepLearningQ)

原文发表时间:2018-10-29

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏电光石火

用mysqlslap进行mysql压力测试

mysqlslap是一个mysql官方提供的压力测试工具,通过模拟多个并发客户端访问mysql来执行测试,使用起来非常的简单。通过mysqlslap--help...

250100
来自专栏腾讯数据库技术

如何快速删除InnoDB中的大表?

23730
来自专栏电光石火

用mysqlslap进行mysql压力测试

mysqlslap是一个mysql官方提供的压力测试工具,通过模拟多个并发客户端访问mysql来执行测试,使用起来非常的简单。通过mysqlslap--he...

274100
来自专栏腾讯云数据库(TencentDB)

【腾讯云CDB】如何快速删除InnoDB中的大表

在使用MySQL时,如果有大表的存储引擎是InnoDB,并且系统参数innodb_file_per_table设置为1,即每个文件对应一个独立的表空间,当对这些...

65110
来自专栏拂晓风起

vc6.0编译时常见错误及改正方法

9620
来自专栏Albert陈凯

SQL语句执行原理清空缓存的方法

文章转载:原文地址 原理: 第一步:应用程序把查询SQL语句发给服务器端执行。 我们在数据层执行SQL语句时,应用程序会连接到相应的数据库服务器,把SQL语句发...

38550
来自专栏北京马哥教育

为MySQL入门者整理的MySQL常用命令

作者:o0DarkNessYY0o 来源:http://blog.csdn.net/o0darknessyy0o/article/details/5208097...

31990
来自专栏我的博客

TP入门第十一天

1、数据库视图 视图通常是指数据库的视图,视图是一个虚拟表,其内容由查询定义。同真实的表一样,视图包含一系列带有名称的列和行数据。但是,视图并不在数据库中以存储...

36160
来自专栏古时的风筝

django开发个人简易Blog——数据模型

提到数据模型,一定要说一下MVC,MVC框架是现代web开发中最流行的开发框架,它将数据与业务逻辑分开,减小了应用之间的高度耦合。个人非常喜欢MVC开发框架,除...

20380
来自专栏测试开发架构之路

CentOS7安装MySQL并设置远程登陆

15640

扫码关注云+社区

领取腾讯云代金券