前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python实现批量识别图片文字,生成对应的txt文件

python实现批量识别图片文字,生成对应的txt文件

作者头像
一写代码就开心
发布2022-05-09 10:43:48
1.6K0
发布2022-05-09 10:43:48
举报
文章被收录于专栏:java和python

目录

百度api

第一步:打开网站

代码语言:javascript
复制
https://ai.baidu.com/

第二步:注册登录

在这里插入图片描述
在这里插入图片描述

第三步:

登录成功,直接输入这个

代码语言:javascript
复制
https://console.bce.baidu.com/ai/?fromai=1#/ai/ocr/overview/index

不用一个一个点击进入这个页面,直接输入上面的地址,只要登录成功,就可以进入

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

以上准备好之后,直接上代码

代码语言:javascript
复制
import os
import time
import uuid

from aip import AipOcr

# 定义常量    换成你网站的
APP_ID = ''
API_KEY = ''
SECRET_KEY = ''

# 初始化AipFace对象

aipOcr = AipOcr(APP_ID, API_KEY, SECRET_KEY)

# 定义参数变量
options = {
    'detect_direction': 'true',
    'language_type': 'CHN_ENG',
}

filePath = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'word')
filePath1 = os.path.join(os.path.dirname(os.path.abspath(__file__)), 'text')
pictures = os.listdir(filePath)


class MetaPicture(object):

    def read_picture(self):



        for picture in pictures:

            picture_path = os.path.join(filePath, picture)
            # print(picture_path)
            # print(picture_path.split('\\')[-1].split('.')[0]  )
            def get_file_content(filePath):
                with open(filePath, 'rb') as fp:
                    return fp.read()

            time.sleep(1)
            # 调用通用文字识别接口
            result = aipOcr.basicGeneral(get_file_content(picture_path), options)
            print(result)
            if len(result) > 2   :

                words_result = result['words_result']

            word = ""
            for i in range(len(words_result)):
                word += words_result[i]['words']
                word += "\n"
            word += "\n\n\n"

            with open(filePath1+'\\'+str(picture_path.split('\\')[-1].split('.')[0])+'.txt', 'w') as text:
                text.write(word)



def main():
    metaPicture = MetaPicture()

    metaPicture.read_picture()

if __name__ == '__main__':
    main()
在这里插入图片描述
在这里插入图片描述
本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-03-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 目录
  • 百度api
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档