服务端 API 文档

诚邀爱技术、爱分享的你,成为文档内容共建者> HOT

产品介绍

票据单据识别(Invoice Optical Character Recognition,Invoice OCR)基于行业前沿的深度学习技术,提供增值税发票识别、火车票识别、出租车票识别、机票行程单识别、运单识别等多种服务,支持将图片上的文字内容,智能识别为结构化的文本,可应用于企业票据报销、金融票据识别、快递单据录入等多种场景,大幅提升信息处理效率。

产品功能

增值税发票识别

支持增值税专用发票、增值税普通发票、增值税电子发票全字段的内容检测和识别,包括发票代码、发票号码、开票日期、合计金额、校验码、税率等。可以应用于财务报销、账单核对等各种需要提取票据信息的场景。

运单识别

支持市面上主流版式电子运单的识别,包括收件人和寄件人的姓名、电话、地址以及运单号等字段。可应用于快递物流的电子运单识别录入等场景,字段识别准确率达到99%以上。

增值税发票(卷票)识别

支持增值税发票(卷票)关键字段的识别,包括发票代码、发票号码、日期、校验码、合计金额(大小写)等。

定额发票识别

支持定额发票关键字段的识别,包括发票号码、发票代码、金额、发票消费类型、地区及是否有公司印章等。

通用机打发票识别

支持通用机打发票关键字段的识别,包括发票代码、发票号码、日期、购买方识别号、销售方识别号、校验码、小写金额等。

火车票识别

支持火车票关键字段的识别,包括编号、票价、姓名、座位号、出发时间、出发站、到达站、车次、席别等。

出租车发票识别

支持出租车发票关键字段的识别,包括发票号码、发票代码、金额、日期、上下车时间、里程、发票所在地、车牌号、发票消费类型及所属地区等。

机票行程单识别

支持机票行程单关键字段的识别,包括姓名、身份证件号码、航班号、票价 、合计、电子客票号码、填开日期等。支持航班信息多行明细输出。

汽车票识别

支持公路汽车客票关键字段的识别,包括发票代码、发票号码、日期、票价、始发地、目的地、姓名、时间、发票消费类型、身份证号、省、市、开票日期、乘车地点、检票口、客票类型、车型、座位号、车次等。

轮船票识别

支持轮船票关键字段的识别,包括发票代码、发票号码、日期、姓名、票价、始发地、目的地、姓名、时间、发票消费类型、省、市、币种等。

过路过桥费发票识别

支持过路过桥费发票关键字段的识别,包括发票代码、发票号码、日期、金额、入口、出口、时间、发票消费类型、高速标志等。

购车发票识别

支持机动车销售统一发票和二手车销售统一发票关键字段的识别,包括发票号码、发票代码、合计金额、合计税额等二十多个字段。

完税证明识别

支持完税证明关键字段的识别,包括税号、纳税人识别号、纳税人名称、金额合计大写、金额合计小写、填发日期、税务机关、填票人等。

OFD 发票识别

支持OFD格式的增值税电子普通发票和增值税电子专用发票的识别,返回发票代码、发票号码、开票日期、验证码、机器编号、密码区,购买方和销售方信息,包括名称、纳税人识别号、地址电话、开户行及账号,以及价税合计、开票人、收款人、复核人、税额、不含税金额等字段信息。

银行回单识别

支持银行回单全字段的识别,包括付款开户行、收款开户行、付款账号、收款账号、回单类型、回单编号、币种、流水号、凭证号码、交易机构、交易金额、手续费、日期等字段信息。

网约车行程单识别

支持网约车行程单关键字段的识别,包括行程起止日期、上车时间、起点、终点、里程、金额等字段。

集装箱识别

支持集装箱箱门信息识别,识别字段包括集装箱箱号、类型、总重量、有效承重、容量、自身重量,具备集装箱箱号、类型不完整或者不清晰的告警功能。

医疗票据识别

支持医疗票据关键字段的识别,目前支持全国统一门诊发票、全国统一住院发票、以及部分地方的门诊和住院发票等。

混贴票据分类

支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。

混贴票据识别

支持多张、多类型票据的混合检测和自动分类,返回对应票据类型。目前已支持增值税发票、增值税发票(卷票)、定额发票、通用机打发票、购车发票、火车票、出租车发票、机票行程单、汽车票、轮船票、过路过桥费发票、酒店账单、客运限额发票、购物小票、完税证明共15种票据。

金融票据整单识别

支持常见银行票据的自动分类和识别。整单识别包括支票(含现金支票、普通支票、转账支票),承兑汇票(含银行承兑汇票、商业承兑汇票)以及进账单等,适用于中国人民银行印发的 2010 版银行票据凭证版式(银发[2010]299 号)。

金融票据切片识别

支持常见银行票据的自动分类和识别。切片识别包括金融行业常见票据的重要切片字段识别,包括大小写金额、账号、票号、收款人、大写日期、同城交换号、地址-省份、地址-城市、付款行全称、支票密码、支票用途等。(金融票据切片:金融票据中待识别字段及其周围局部区域的裁剪图像)。

产品优势

能力全面

支持十余种常见票据单据的识别,如增值税发票及卷票、定额发票、购车发票、火车票、出租车发票、机票行程单、电子运单、过路过桥费发票、银行回单、完税证明、通用机打发票等,覆盖字段多、识别信息全面。

算法领先

各字段精度高,以增值税发票为例,发票代码、价税合计、合计金额、购买方识别号、开票日期等字段识别准确率达到99%以上。

场景丰富

支持单张票据、多张票据混贴识别,支持照片、扫描件识别,不受拍摄角度、背景、亮度、折痕、内容错位等不利因素干扰。

应用场景

企业财务报销

用于企业员工发票报销,通过 OCR 技术提取各种纸质发票、凭证上的发票号码、金额、发票代码等关键信息,支持数据录入和自动核对,减少人工校验成本。

金融票据管理

支持企业、银行、个人等多种支票、银行承兑汇票、商业承兑汇票以及进账单等金融票据的整单识别和切片识别,代替人工录入,提升处理效率。

生活记账理财

在理财记账、日程管理等应用中,通过 OCR 技术识别提取票据关键信息实现个人账单、出行日程的记录,辅助用户合理规划生活。

目录