前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python实现图片文字提取,准确率高达99%,100多个功能全给你!

Python实现图片文字提取,准确率高达99%,100多个功能全给你!

作者头像
程序员晚枫
发布2023-03-02 16:26:46
4.8K0
发布2023-03-02 16:26:46
举报
文章被收录于专栏:自动化办公自动化办公

大家好,这里是程序员晚枫。

趁着假期,给大家更新了100多个文字识别的自动化办公专用功能,本周写了3篇文章介绍了其中3个:

假期结束要上班了,今天一股脑把所有功能都给大家介绍一遍~

先记住一条:使用方式一模一样

代码说话,

代码语言:javascript
复制

# pip install potencent
import potencent

# 识别增值税发票
ressult = potencent.ocr.VatInvoiceOCR()
# 识别银行卡
ressult = potencent.ocr.BankCardOCR()
# 识别身份证
ressult = potencent.ocr.IDCardOCR()

... ...

细心的你一定发现了:如上述代码所示,👆。

  • 所有功能都是1行代码搞定。
  • 使用的方法也基本一致:import potencent后,potencent.ocr.你想调用的功能名

问题来了:能调用的功能名有哪些呢?

我把所有功能都列在下面的表格里:可以调用的功能接口 + 功能说明。

例如需要使用第一个功能:广告文字识别,按照上面介绍的逻辑,你只需要把调用的功能名加在最后即可:potencent.ocr.AdvertiseOCR。

关于参数的使用,可以看之前的介绍,都是一样的👉参数说明

通用文字识别相关接口

接口名称

接口功能

AdvertiseOCR

广告文字识别

GeneralBasicOCR

通用印刷体识别

ImageEnhancement

文本图像增强

RecognizeHealthCodeOCR

健康码识别

RecognizeTravelCardOCR

通信行程卡识别

GeneralAccurateOCR

通用印刷体识别(高精度版)

GeneralEfficientOCR

通用印刷体识别(精简版)

GeneralFastOCR

通用印刷体识别(高速版)

EnglishOCR

英文识别

GeneralHandwritingOCR

通用手写体识别

TextDetect

快速文本检测

卡证文字识别相关接口

接口名称

接口功能

BankCardOCR

银行卡识别

BizLicenseOCR

营业执照识别

BusinessCardOCR

名片识别

ClassifyDetectOCR

智能卡证分类

EnterpriseLicenseOCR

企业证照识别

EstateCertOCR

不动产权证识别

HKIDCardOCR

中国香港身份证识别

HmtResidentPermitOCR

港澳台居住证识别

IDCardOCR

身份证识别

InstitutionOCR

事业单位法人证书识别

MLIDCardOCR

马来西亚身份证识别

MLIDPassportOCR

护照识别(港澳台地区及境外护照)

MainlandPermitOCR

港澳台来往内地通行证识别

OrgCodeCertOCR

组织机构代码证识别

PassportOCR

护照识别(中国大陆地区护照)

PermitOCR

港澳台通行证识别

PropOwnerCertOCR

房产证识别

RecognizeIndonesiaIDCardOCR

印尼身份证识别

RecognizePhilippinesDrivingLicenseOCR

菲律宾驾驶证识别

RecognizePhilippinesVoteIDOCR

菲律宾VoteID识别

RecognizeThaiIDCardOCR

泰国身份证识别

ResidenceBookletOCR

户口本识别

票据单据识别相关接口

接口名称

接口功能

BankSlipOCR

银行回单识别

BusInvoiceOCR

汽车票识别

CarInvoiceOCR

购车发票识别

DutyPaidProofOCR

完税证明识别

FinanBillOCR

金融票据整单识别

FinanBillSliceOCR

金融票据切片识别

FlightInvoiceOCR

机票行程单识别

InvoiceGeneralOCR

通用机打发票识别

MixedInvoiceDetect

混贴票据分类

MixedInvoiceOCR

混贴票据识别

QuotaInvoiceOCR

定额发票识别

RecognizeContainerOCR

集装箱识别

RecognizeMedicalInvoiceOCR

医疗票据识别

RecognizeOnlineTaxiItineraryOCR

网约车行程单识别

ShipInvoiceOCR

轮船票识别

TaxiInvoiceOCR

出租车发票识别

TollInvoiceOCR

过路过桥费发票识别

TrainTicketOCR

火车票识别

VatInvoiceOCR

增值税发票识别

VatRollInvoiceOCR

增值税发票(卷票)识别

VerifyOfdVatInvoiceOCR

OFD发票识别

WaybillOCR

运单识别

汽车场景识别相关接口

接口名称

接口功能

DriverLicenseOCR

驾驶证识别

LicensePlateOCR

车牌识别

RideHailingDriverLicenseOCR

网约车驾驶证识别

RideHailingTransportLicenseOCR

网约车运输证识别

VehicleLicenseOCR

行驶证识别

VehicleRegCertOCR

机动车登记证书识别

VinOCR

车辆VIN码识别

行业文档识别相关接口

接口名称

接口功能

RecognizeTableOCR

表格识别(V2)

ArithmeticOCR

算式识别

EduPaperOCR

数学试题识别

FormulaOCR

数学公式识别

InsuranceBillOCR

保险单据识别

SealOCR

印章识别

SmartStructuralOCR

智能结构化识别

TableOCR

表格识别(V1)

智能扫码相关接口

接口名称

接口功能

QueryBarCode

条码信息查询

QrcodeOCR

二维码和条形码识别

注意事项

potencent所有功能的实现,都依托于腾讯云的文字识别

开通功能以后,请在同级目录下配置一个potencent-config.toml文件。文件位置和内容如下图所示。👇

代码语言:javascript
复制
[tencent-ai]
TENCENTCLOUD_SECRET_ID = '你的 SecretId'     # 建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考:https://cloud.tencent.com/act/cps/redirect?redirect=36394&cps_key=ca76be5a2293ba3906d6d5407aea15ee
TENCENTCLOUD_SECRET_KEY = '你的 SecretKey'   # 建议使用子账号密钥,授权遵循最小权限指引,降低使用风险。子账号密钥获取可参考:https://cloud.tencent.com/act/cps/redirect?redirect=36394&cps_key=ca76be5a2293ba3906d6d5407aea15ee

另外,如果需要自定义配置文件名称和位置,可以使用configPath参数,具体使用请看GitHub源码。

  • GitHub源码地址:https://github.com/CoderWanFeng/potencent

大家在阅读本文和使用代码中有任何问题,欢迎在评论区进行交流~

-END-

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2023-01-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python自动化办公社区 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 先记住一条:使用方式一模一样
  • 问题来了:能调用的功能名有哪些呢?
    • 通用文字识别相关接口
      • 卡证文字识别相关接口
        • 票据单据识别相关接口
          • 汽车场景识别相关接口
            • 行业文档识别相关接口
              • 智能扫码相关接口
              • 注意事项
              相关产品与服务
              文字识别
              文字识别(Optical Character Recognition,OCR)基于腾讯优图实验室的深度学习技术,将图片上的文字内容,智能识别成为可编辑的文本。OCR 支持身份证、名片等卡证类和票据类的印刷体识别,也支持运单等手写体识别,支持提供定制化服务,可以有效地代替人工录入信息。
              领券
              问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档