文档中心>文字识别

OCR-营业执照识别

最近更新时间:2021-07-28 17:21:26

我的收藏
Note:
营业执照识别接口全面升级,算法更强、性能更优,支持子账号调用。欢迎立即体验 新版营业执照识别
新老版本的接口计费模式相同,且共享计费阶梯和资源包,您可以在【文字识别控制台】>【用量统计】中查看调用情况。
老版本接口我们仍继续维护,但不支持新客户开通调用,建议您使用 新版营业执照识别,体验更优服务。
接口请求域名:https://recognition.image.myqcloud.com/ocr/bizlicense 本接口(bizlicense)用于识别用户上传的营业执照图像,返回注册号、法定代表人、公司名字、地址、营业期限这5个字段信息。
Note:
本接口支持 HTTPS 协议,如果您现在使用的是 HTTP 协议,为了保障您的数据安全,请切换至 HTTPS。

请求头 header

参数名
必选
描述
host
recognition.image.myqcloud.com
腾讯云文字识别服务器域名。
content-length
包体总长度
每个请求的包体大小限制为6MB,不支持 .gif 类型的动图。
content-type
application/json 或者 multipart/form-data
根据不同接口选择:
1. 使用 application/json 格式,参数为 url 或 image,其值为图片链接或图片 base64编码;
2. 使用 multipart/form-data 格式,参数为 image,其值为图片的二进制内容。
authorization
鉴权签名
多次有效签名,用于鉴权, 具体生成方式详见 鉴权签名方法
Note:
如选择 multipart/form-data,请使用 HTTP 框架/库推荐的方式设置请求的 content-type,不推荐直接调用 setheader 等方法设置,否则可能导致 boundary 缺失引起请求失败。

输入参数

参数名
必选
类型
参数说明
appid
String
接入项目的唯一标识,可在 账号信息云 API 密钥 中查看。
image
Binary/String
图片文件 或 图片 base64。图片需指定 filename,filename 的值为可为空,响应 HTTP body 中会返回用户设置的 filename 值。
url
String
图片 url 和 image 同时赋值时,则以 url 指定的图像作为输入。

输出内容

参数
类型
描述
items
JSON 数组
具体查询数据,内容见下表
items( JSON 数组):
参数
类型
描述
item
String
字段名称(取值为注册号、法定代表人、公司名字、地址、营业期限)
itemstring
String
字段结果
itemcoord
Object
字段在图像中的像素坐标,包括左上角坐标 x、y,以及宽 width、高 height
itemconf
Float
识别结果对应的置信度
返回字段为一个 JSON 数组,其中每一项的内容如下:
参数
类型
描述
code
Int
错误码
message
String
错误描述
data
Object
返回数据

示例

输入示例

使用 application/json

POST /ocr/bizlicense HTTP/1.1
Host: recognition.image.myqcloud.com
Authorization: oubqBjgP/2I8JQmlRStAUkQWXwJhPTEwMDAwMDEmYj1xaW5pdXRlc3QyJms9QUtJRG1PNWNQVzNMREdKc2FyREVEY1ExRnByWlZDMW9wZ3FYJmU9MTUyNTIyOTcxNyZ0PTE1MjI2Mzc3MTcmcj0xMTkyNzc3NDc2JnU9MCZmPQ==
Content-Type: application/json

{
"appid":"1234567",
"url":"https://test.com/aaa.jpg"
}


使用 multipart/form-data

POST /ocr/bizlicense HTTP/1.1
Host: recognition.image.myqcloud.com
Authorization: oubqBjgP/2I8JQmlRStAUkQWXwJwMDAwMDfmYj1xaW5pdXRlc3FyJms9QUtJRG1PNWVzNMREdKc2FyREVEY1ExRnByWlZDMW9wZ3FYJmU9UyNTIyOTcxNyZ0PTE1MjI2Mzc3MTcmcj0xMTkyNzc3NDc2JnU9MCasdf==
Content-Type: multipart/form-data; boundary=----acebdf13572468

------acebdf13572468
Content-Disposition: form-data; name="image"; filename="test.jpg"
Content-Type: image/jpeg

image_content
------acebdf13572468
Content-Disposition: form-data; name="appid"

1234567
------acebdf13572468--

输出示例

{
"code": 0,
"message": "OK",
"data": {
"session_id": "1000001-1095565554",
"items": [
{
"item": "注册号",
"itemcoord": {
"x": 600,
"y": 590,
"width": 205,
"height": 24
},
"itemconf": 0.9469727277755736,
"itemstring": "913709027242123456",
"coords": [],
"words": [],
"candword": []
},
{
"item": "法定代表人",
"itemcoord": {
"x": 358,
"y": 804,
"width": 98,
"height": 27
},
"itemconf": 0.999782145023346,
"itemstring": "腾小云",
"coords": [],
"words": [],
"candword": []
},
{
"item": "公司名称",
"itemcoord": {
"x": 358,
"y": 652,
"width": 302,
"height": 28
},
"itemconf": 0.9998672008514404,
"itemstring": "腾讯科技(深圳)有限公司",
"coords": [],
"words": [],
"candword": []
},
{
"item": "地址",
"itemcoord": {
"x": 361,
"y": 750,
"width": 207,
"height": 28
},
"itemconf": 0.999684989452362,
"itemstring": "深圳市南山区深南大道10000",
"coords": [],
"words": [],
"candword": []
},
{
"item": "营业期限",
"itemcoord": {
"x": 347,
"y": 957,
"width": 424,
"height": 28
},
"itemconf": 0.9370071887969972,
"itemstring": "自1998年11月11日至长期",
"coords": [],
"words": [],
"candword": []
}
]
}
}

错误码

错误码
含义
3
错误的请求;其中 message:account abnormal,error no is:2 为账号欠费停服
4
签名为空
5
签名串错误
6
签名中的 APPID/Bucket 与操作目标不匹配
9
签名过期
10
APPID 不存在
11
SecretId 不存在
12
APPID 和 SecretId 不匹配
13
重放攻击
14
签名校验失败
15
操作太频繁,触发频控
16
Bucket 不存在
21
无效参数
23
请求包体过大
24
没有权限
25
您购买的资源已用完
107
鉴权服务内部错误
108
鉴权服务不可用
213
内部错误
-1102
图片解码失败
-1300
图片为空
-1301
参数为空
-1304
参数过长
-1308
图片下载失败
-5208
服务器内部错误
-9001
请求 type 错误,不是0或1
-9002
识别失败
-9005
图片无效
-9006
预处理失败
-9502
营业执照 OCR 识别失败
-9501
营业执照 OCR 预处理失败
更多其他 API 错误码请查看 错误码说明