Note:
通用印刷体识别接口全面升级,算法更强、性能更优,支持子账号调用。欢迎立即体验 新版通用印刷体识别。
新老版本的接口计费模式相同,且共享计费阶梯和资源包,您可以在【文字识别控制台】>【用量统计】中查看调用情况。
老版本接口我们仍继续维护,但不支持新客户开通调用,建议您使用 新版通用印刷体识别,体验更优服务。
接口描述
接口请求域名:
https://recognition.image.myqcloud.com/ocr/general
本接口(general)用于提供图片整体文字的检测和识别服务,返回文字框位置与文字内容。支持多场景、任意版面下整图文字的识别,以及中英文、字母、数字的识别。应用场景:印刷文档识别、广告图文字识别、街景店招识别、菜单识别、视频标题识别、互联网头像文字识别等。Note:
本接口支持 HTTPS 协议,如果您现在使用的是 HTTP 协议,为了保障您的数据安全,请切换至 HTTPS。
请求头 header
所有请求都要求含有以下头部信息:
参数名 | 必选 | 值 | 描述 |
host | 是 | recognition.image.myqcloud.com | 腾讯云文字识别服务器域名。 |
content-length | 否 | 包体总长度 | 每个请求的包体大小限制为6MB,不支持 .gif 类型的动图。 |
content-type | 是 | application/json 或者 multipart/form-data | 根据不同接口选择: 1. 使用 application/json 格式,参数 url 或 image,其值为图片链接或图片 base64 编码。 2. 使用 multipart/form-data 格式,参数为 image,其值为图片的二进制内容。 |
authorization | 是 | 鉴权签名 |
Note:
如选择 multipart/form-data,请使用 HTTP 框架/库推荐的方式设置请求的 content-type,不推荐直接调用 setheader 等方法设置,否则可能导致 boundary 缺失引起请求失败。
输入参数
输出参数
字段 | 类型 | 说明 |
data.session_id | String | 相应请求的 session 标识符 |
data.items | Array(item) | 识别出的所有字段信息 |
code | Int | 错误码 |
message | String | 错误描述 |
item 说明:
字段 | 类型 | 说明 | |
itemstring | | String | 字段内容 |
itemcoord | x | Int | item 框左上角 x |
| y | Int | item 框左上角 y |
| width | Int | item 框宽度 |
| height | Int | item 框高度 |
words | | Array(word) | 每个字的信息 |
words 说明:
字段 | 类型 | 说明 |
character | String | 单字的内容 |
confidence | Float | 这个字的置信度,取值范围 [0,100] |
示例
输入示例
使用 application/json
POST /ocr/general HTTP/1.1Authorization: FCHXdPTEwMDAwMzc5Jms9QUtJRGVRZDBrRU1yM2J4ZjhRckJi==Host: recognition.image.myqcloud.comContent-Length: 187Content-Type: application/json{"appid":"123456","url":"http://test-123456.image.myqcloud.com/test.jpg"}
使用 multipart/form-data
POST /ocr/general HTTP/1.1Authorization: FCHXdPTEwMDAwMzc5Jms9QUtJRGVRZDBrRU1yM2J4ZjhRckJi==Host: recognition.image.myqcloud.comContent-Length: 735Content-Type: multipart/form-data;boundary=--------------acebdf13572468----------------acebdf13572468Content-Disposition: form-data; name="appid";123456----------------acebdf13572468Content-Disposition: form-data; name="bucket";test----------------acebdf13572468Content-Disposition: form-data; name="image"; filename="test.jpg"Content-Type: image/jpegxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx----------------acebdf13572468--
输出示例
HTTP/1.1 200 OKConnection: keep-aliveContent-Length: 404Content-Type: application/json{"data":{"items":[{"itemstring":"手机","itemcoord":{"x":0,"y":100,"width":40,"height":20},"words":[{"character":"手","confidence":90.9},{"character":"机","confidence":93.9}]}],"session_id":"",},"code":0,"message":"OK"}
错误码
错误码 | 含义 |
3 | 错误的请求;其中 message:account abnormal,error no is:2为账号欠费停服 |
4 | 签名为空 |
5 | 签名串错误 |
6 | 签名中的 APPID/Bucket 与操作目标不匹配 |
9 | 签名过期 |
10 | APPID 不存在 |
11 | SecretId 不存在 |
12 | APPID 和 SecretId 不匹配 |
13 | 重放攻击 |
14 | 签名校验失败 |
15 | 操作太频繁,触发频控 |
16 | Bucket不存在 |
21 | 无效参数 |
23 | 请求包体过大 |
24 | 没有权限 |
25 | 您购买的资源已用完 |
107 | 鉴权服务内部错误 |
108 | 鉴权服务不可用 |
213 | 内部错误 |
-1102 | 图片解码失败 |
-1300 | 图片为空 |
-1301 | 参数为空 |
-1304 | 参数过长 |
-1308 | 图片下载失败 |
-9021 | 未检测到文本 |
-9003 | OCR 识别失败 |