有奖捉虫:云通信与企业服务文档专题,速来> HOT
通过本文您可以了解数据万象各能力的使用限制和功能支持的服务地域。

图片处理

图片基础处理

支持格式:图片处理支持的格式区分为普通格式高级格式,具体支持的格式可参见 格式说明
静图体积限制:处理后的图和原图大小均不可超过32MB、宽高不可超过50000px且总像素不可超过2.5亿px。
WebP 图片限制:处理后的图和原图大小均不可超过32MB、宽高不可超过16383px且总像素不可超过2.5亿px。
动图体积限制:处理后的图和原图的宽 x 高 x 帧数均不可超过2.5亿px。
动图帧数限制:帧数限300帧。
参数使用限制:处理参数中涉及宽高的参数值不得超过10000px,超过10000px将按10000px处理。
说明:
参数使用示例:限定缩略图的宽度和高度的最大值分别为 Width 和 Height,进行等比缩放:/thumbnail/<Width>x<Height>其中 Width 和 Height 如果超过10000px,将默认按10000px进行处理。

图片压缩服务

Guetzli 图片压缩:支持对总像素小于1600万的 JPG 图片进行压缩。
图片高级压缩:与基础图片处理相同。
图片极智压缩:原图格式仅支持 PNG、JPG/JPEG、GIF。

盲水印

不支持为动图(例如 GIF 图片)添加盲水印。
水印图的宽高不得超过原图的1/8。
文字盲水印支持数字[0 - 9]及英文大小写[A - Z,a - z]。

异常图片检测

支持格式:JPG/JPEG、PNG、BMP、WebP、GIF,以及纯 TS 视频流(更改为任意后缀)。
静态图体积限制:可检测的原图大小不超过32MB,宽高不超过50000px且总像素不超过2.5亿px。
动图体积限制:宽 x 高 x 帧数不超过2.5亿px。
动图帧数限制:帧数限300帧。

地域限制

功能
使用地域
图片基础处理
全地域支持
图片高级压缩
全地域支持
图片极智压缩
支持中国大陆园区,包括北京、上海、广州、南京、成都、重庆
Guetzli 压缩
支持中国大陆园区,包括北京、上海、广州、南京、成都、重庆
盲水印
全地域支持
异常图片检测
全地域支持
智能海报生成
全地域支持

格式说明

类别
支持的原图格式
支持的处理方式
可转换为以下格式
说明
普通格式
jpg/jpeg、png、bmp、webp、tiff、gif
持久化处理
下载时处理
jpg/jpeg、png、apng、bmp、webp、tiff、gif、avif、heif/heic、tpg
如需转换图片为 avif、heif/heic、tpg 格式,请先开通 图片高级压缩
有关持久化处理和下载时处理的区别,请查看 图片处理机制介绍
高级格式
avif、heif/heic、tpg、apng
持久化处理
下载时处理
psd、svg、raw、ai、eps、dng、cr3、crw、mos、erf、3fr、fff、kdc、dcr、rw2、pef、sr2、srf、arw、nef、nrw、orf、mef、mrw
持久化处理



媒体处理

支持的音视频编码格式:H264、H265、VP8、VP9、AV1 等。
支持的音视频封装格式:avi、mp4、mkv、mov、webm、opus、flv、hls、ts、dash、mp3、aac、flac 、wav、amr 等。
倍速队列仅支持处理转码任务。
媒体处理任务并发任务默认限制为10个QPS。
说明:
如需使用广电专业格式转码功能,请 联系我们 开通白名单。

地域限制

媒体处理各项功能均支持以下园区:
中国大陆园区:北京、上海、广州、成都、重庆、南京。
海外园区:中国香港、硅谷、新加坡、孟买、东京、首尔、雅加达、圣保罗、法兰克福。
音视频转码能力不同园区收费标准不同,详情请见 媒体处理费用



内容审核

图片审核

图片文件大小支持:支持审核32MB以下的图片,对于大小超过5MB的图片,您需要在调用请求时,使用 large-image-detect 参数,或开启大图审核功能。
图片文件分辨率支持:需大于20px * 20px,需小于40000px * 40000px(同步审核需小于10000px * 10000px),建议分辨率大于256px * 256px,否则可能会影响识别效果。
图片文件支持格式:PNG、JPG、JPEG、BMP、GIF、WEBP、HEIF、HEIC 格式。

视频审核

视频文件大小支持:文件 < 5GB。
视频文件支持格式:flv、mkv、mp4、rmvb、avi、wmv、3gp、mov、m3u8、m4v 等。

音频审核

音频文件大小支持:文件 < 600MB。
音频文件时长支持:< 3小时。
音频码率类型支持:128Kbps - 256Kbps。
音频文件支持格式:mp3、wav、aac、flac、amr、3gp、m4a、wma、ogg、ape。
音频文件内容语言支持:普通话、英语、粤语。
当输入为视频文件时,支持分离视频文件音轨,并对音频内容进行独立审核。

文本审核

支持直接审核文本内容:需先经过base64编码,文本编码前的原文长度不能超过10000个 utf8 编码字符。
支持审核文本格式文件,例如 txt、html:仅支持 UTF8 编码和 GBK 编码,大小不能超过1MB。
文本审核语言支持:目前支持普通话、英文、阿拉伯数字的检测。 

网页审核

支持审核网页内的图片及文本。

直播审核

直播流时长支持:5小时以内。
直播流分辨率支持:最大支持1920x1080 (1080p)。
支持的直播流媒体协议:rmtp、hls、http、https 等主流协议。
默认并发审核路数限制:10路,超过并发审核路数,接口会返回错误。

地域限制

内容审核各项功能均支持以下园区:
中国大陆园区:北京、上海、广州、成都、重庆、南京。
海外园区:中国香港、新加坡、孟买、法兰克福。
说明:
如需在其他园区使用内容审核,请 联系我们 咨询。



内容识别

二维码识别/图片标签识别

支持识别 PNG、JPEG、JPG 格式图片。
图片大小不超过3MB,图片宽高大于 50px * 50px。

图像修复/图像增强/智能裁剪/商品抠图/图片上色/图像主体检测/logo 识别/游戏场景识别

支持 PNG、JPEG、JPG 格式图片。
输入图片大小不超过5MB。
限制输入图片最大分辨率为7680px * 4320px,最小分辨率为32px * 32px。

人脸特效

图片 base64编码后大小不可超过5MB。
支持 PNG、JPEG、JPG、BMP 格式,不支持 GIF 图片。
当使用人像分割时,图片分辨率须小于2000px * 2000px。

图像超分

限制输入图片最大分辨率为1920px * 1920px,最小分辨率为32px * 32px。
限制输入文件最大为5MB。
支持处理 PNG、JPEG、JPG 格式图片。

身份证识别

要求图片经 base64 编码后不超过7M。
分辨率建议500px * 800px,
支持 PNG、JPEG、JPG、BMP 格式。建议卡片部分占据图片2/3以上。

活体人脸检测

用于活体检测的视频 base64编码后的大小不超过8M。
支持 mp4、avi、flv 格式。

图片 ocr 识别

支持 PNG、JPG、JPEG、BMP 格式图片,不支持 GIF 图片。
支持 PDF。
所下载图片经 Base64编码后不超过7M。
建议分辨率在600px * 800px以上,限制输入图片最大分辨率为7680px * 4320px,最小分辨率为32px * 32px。

卡证识别

支持 PNG、JPG、JPEG、BMP、PDF ,不支持 GIF 图片。建议卡片部分占据图片2/3以上。
所下载图片经 Base64编码后不超过5M。
建议分辨率在600px * 800px以上,限制输入图片最大分辨率为7680px * 4320px,最小分辨率为32px * 32px。

默认并发限制

图片修复:2 QPS
图片文字识别 OCR:10 QPS
图片标签:20 QPS
其他AI智能功能:5 QPS
说明:
如需更大并发数,请 联系我们 开通白名单。

地域限制

功能
使用地域
二维码识别
全地域支持
图片标签
图片质量评估
中国大陆园区:支持北京、上海、广州、成都、重庆、南京
海外园区:支持中国香港、新加坡、法兰克福
人脸识别
人脸核身
图片OCR识别
以图搜图
车辆识别
图像修复
中国大陆园区:支持北京、上海、广州、成都、重庆、南京
海外园区:支持中国香港、新加坡
商品抠图
图片超分
图像增强
文字翻译



文档处理

文档预览支持格式

文档转图片及文档转 html 功能所支持的文档格式限制如下:
文档类型
支持格式
演示文件
pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm
文字文件
doc、dot、wps、wpt、docx、dotx、docm、dotm
表格文件
xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm、ets
其他格式文件
pdf、 lrc、 c、 cpp、 h、 asm、 s、 java、 asp、 bat、 bas、 prg、 cmd、 rtf、 txt、 log、 xml、 htm、 html

文档预览大小限制

文档预览支持输入文件大小限制在200MB 之内,输入文件页数限制在5000页之内。

默认并发限制

功能
QPS
文档转图片(同步)
100
文档转图片(异步)
创建任务、查询任务共用100QPS,并发任务数量默认为10个
文档转 html
100

地域限制

功能
使用地域
文档转图片(异步)
中国大陆园区:支持北京、上海、广州、成都、重庆、南京 海外园区:支持中国香港、硅谷、新加坡、法兰克福
文档转图片(同步)
中国大陆园区:支持北京、上海、广州、成都、重庆、南京
海外园区: 支持法兰克福
文档转 html
中国大陆园区:支持北京、上海、广州、成都、重庆、南京 海外园区: 支持弗吉尼亚、法兰克福

并发任务处理数量限制

文档转图片(异步)并发任务处理数量默认上限为10。


文件处理

哈希值计算限制

同步请求支持计算小于128MB大小的文件,异步任务支持计算小于50GB大小的文件。

多文件打包限制

文件数量限制:最多支持将1000万个文件打包到一个压缩包中,超出限制将返回任务失败。
压缩包大小限制:打包后的压缩包不得大于50TB。

解压限制

支持解压小于5TB的压缩包文件。
支持解压的文件格式:zip、tar、gz、7zip、rar、apk。

地域限制

功能
使用地域
文件哈希值计算
仅支持北京、南京、上海、广州、成都、重庆、中国香港、新加坡、硅谷
文件解压缩
多文件打包



智能语音

语音识别

支持中文普通话、英语和粤语的语音识别。
识别格式:wav、mp3、m4a。
普通 ASR 语音文件的时长不能大于5小时,文件大小不超过512MB。
极速 ASR 仅支持100MB以内且时长不超过2小时的音频文件。

语音合成

支持合成 wav、mp3、m4a 格式音频。

音乐评分

音乐评分处理文件需小于10分钟,如源文件大于10分钟,请分段后进行处理。
支持输入类型为 mp3、wav、aac、flac、m4a、mp4、ts、hls 等音视频文件。

音频智能处理

支持处理 mp4、avi、mp3、aac、ts 等格式文件。
支持输出 wav、mp3、m4a、aac、flac 格式音频。
人声分离仅支持时长小于45分钟的源文件。