前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >入门案例!批量识别发票自动保存为Excel文件,1行Python代码实现(支持PDF格式)

入门案例!批量识别发票自动保存为Excel文件,1行Python代码实现(支持PDF格式)

原创
作者头像
程序员晚枫
修改2024-05-20 12:29:10
133017
代码可运行
修改2024-05-20 12:29:10
举报
文章被收录于专栏:自动化办公自动化办公
运行总次数:17
代码可运行

大家好,这里是程序员晚枫

上一篇文章给大家更新了受欢迎的功能:入门案例!批量识别发票自动保存为Excel文件,1行Python代码实现,但之前的文章对于发票识别有一个遗留问题:

只能识别图片格式的发票,但系统下载下来的往往是PDF格式,所以还需要把PDF转为图片,才能进行批量识别。

本周末在多位观众的督促下,加班加点更新了直接识别PDF的功能,下面介绍一下使用方法~(基本没变化,看一眼就会了),文末也有配套的视频教程,不想看文字的朋友可以直接去看视频。

准备工作

看过之前视频教程的朋友请注意,在Terminal里更新一下poocr,更新命令如下:

代码语言:shell
复制
pip install poocr -U

有任何疑问也欢迎大家在本文的评论区和我交流~

批量识别的代码

为了不给大家增加使用难度,使用代码和原来批量识别图片发票的一样。

代码语言:python
代码运行次数:17
复制
import poocr

SecretId = '腾讯云OCR:https://curl.qcloud.com/v0BcWo7t:'
SecretKey = '腾讯云OCR:https://curl.qcloud.com/v0BcWo7t'

pdf_path = r'C:\work\程序员晚枫的发票文件夹'

poocr.ocr2excel.VatInvoiceOCR2Excel(input_path=pdf_path, id=SecretId, key=SecretKey, file_name=True)

参数说明:

  • pdf_path:这里填你的PDF发票所在的文件夹
  • file_name:识别结果里,要不要增加一列:发票的文件名。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 准备工作
  • 批量识别的代码
相关产品与服务
文字识别
文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档