前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >实战案例!用1行Python代码识别增值税发票,然后用爬虫将数据自动录入系统

实战案例!用1行Python代码识别增值税发票,然后用爬虫将数据自动录入系统

作者头像
程序员晚枫
发布2023-03-02 16:24:44
8300
发布2023-03-02 16:24:44
举报
文章被收录于专栏:自动化办公自动化办公

大家好,这里是程序员晚枫。

上次给大家分享了:我用一行Python代码还原了黑白照片,外婆哭了,今天我们继续看看1行Python代码能带来哪些惊喜~

录入发票是一件繁琐的工作,如果可以自动识别并且录入系统,那可真是太好了。

接下来我们就来学习一下,如何自动识别增值税发票并且录入系统吧~

第一步:识别发票 - 人工智能

识别发票的代码最简单,只需要1行代码,如下所示。👇

识别后的返回结果,包含发票信息如下,几乎涵盖所有发票上肉眼可见的内容。👇

面对这个返回数据,你当然可以使用之前推荐过的小破站账号:Python自动化办公社区里播放第一的Excel自动化办公课程,把它转换到Excel里,这里不再重复。传送门:Python + Excel自动化办公,学习路线是什么?想学,又不想学太多。

注意事项

该功能的实现,依托于腾讯云的发票识别,所以在同级目录下,需要配置一个potencent-config.toml文件。文件位置和内容如下图所示。👇

代码语言:javascript
复制
[tencent-ai]
TENCENTCLOUD_SECRET_ID = '你的 SecretId'     # 建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考https://cloud.tencent.com/document/product/598/37140
TENCENTCLOUD_SECRET_KEY = '你的 SecretKey'   # 建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考https://cloud.tencent.com/document/product/598/37140

另外,如果需要自定义配置文件名称和位置,可以使用configPath参数,具体使用请看Github源码。

第二步:自动化录入系统 - 爬虫

光把发票信息识别出来还不够,如果能自动录入系统,那就完美了。

在编程语言中,把从网站下载数据和将信息录入网页的操作,统称为爬虫。更直白的理解,所有人类可以对网站进行的操作,Python都可以做,而且可以更快速更准确。而这一部分爬虫方面的知识,直接看Python爬虫大神崔老师的课程就可以一站式搞定了:https://et10.lagou.com/xRCFRkRAsuFA3

这套课程的知识非常实用,不论是工作还是学习,都是不错的选择。赶紧学起来吧~

-END-

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-01-25,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python自动化办公社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 第一步:识别发票 - 人工智能
    • 注意事项
    • 第二步:自动化录入系统 - 爬虫
    相关产品与服务
    增值税发票核验
    增值税发票核验(Value-Added Tax Invoice Verification,VTIV)基于行业前沿的深度学习技术,为您提供增值税发票的识别及信息准确性核验服务。产品支持多种发票类型,可应用于企业费控报销管理、供应链发票核验、财税代理记账等场景。产品智能、快速、稳定、安全,满足您的多样性业务需求。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档