API 文档

SDK 文档

诚邀爱技术、爱分享的你,成为文档内容共建者> HOT
分类 功能 规则与限制
图片基础处理 总限制
  • 支持格式:支持处理 JPG、JPEG 2000(JP2)、BMP、GIF、PNG、WEBP 格式,并且支持 HEIF 格式的解码和处理操作。
  • 体积限制:处理图片原图大小不超过32MB、宽高不超过30000像素且总像素不超过2.5亿像素,处理结果图宽高设置不超过9999像素;针对动图,原图宽 x 高 x 帧数不超过2.5亿像素。
  • 动图帧数限制:gif 帧数限300帧。
  • 格式转换
  • gif、webp、tpg 等动图,支持互相转换。
  • jpg、png、bmp、tpg、heif 等静态图片,支持互相转换。
  • 质量变换 支持 jpg、webp、tpg、heif、avif 格式图片。
    渐进显示 仅支持 jpg 格式,如果输出非 jpg 图片格式,会忽略该参数。
    图片水印
  • 一张图片上,最多添加10张不同的图片水印。
  • 不支持添加动图作为水印。
  • 管道操作符 可实现对图片按顺序进行多种处理,最多支持10层管道。
    图片增值服务 Guetzli 图片压缩 仅对质量 q > 70、像素 < 1600万的 jpg 图片进行处理。
    WebP 压缩
  • 支持格式:支持将 jpg、png、bmp、gif、tpg、heif、avif 等格式图片转换为 webp 格式。
  • 体积限制:处理图片原图大小不超过32MB、宽高不超过30000像素且总像素不超过2.5亿像素,处理结果图宽高设置不超过9999像素;针对动图,原图宽 x 高 x 帧数不超过2.5亿像素。
  • 动图帧数限制:gif 帧数限300帧。
  • 图片高级压缩
  • 支持格式:
    1. HEIF 压缩:支持将 jpg、png、bmp、webp、tpg、avif 等格式图片转换为 heif 格式。
    2. TPG 压缩:支持将 jpg、png、bmp、gif、webp、heif、avif 等格式图片转换为 tpg 格式。
    3. AVIF 压缩:支持将 jpg、png、bmp、gif、webp、tpg、heif 等格式图片转换为 avif 格式。
  • 体积限制:处理图片原图大小不超过32MB、宽高不超过30000像素且总像素不超过2.5亿像素,处理结果图宽高设置不超过9999像素;针对动图,原图宽 x 高 x 帧数不超过2.5亿像素。
  • 动图帧数限制:gif 帧数限300帧。
  • 盲水印
  • 暂不支持为动图(例如 gif 图片)添加盲水印。
  • 水印图的宽高不得超过原图的1/8。
  • 文字盲水印支持数字[0 - 9]及英文大小写[A - Z,a - z]。
  • 媒体处理服务 视频处理 支持的音视频格式:avi、mp4、mkv、flv、hls、ts、mp3、aac、flac 等。
    注意:如需使用超分辨率、视频增强、SDRtoHDR 功能,请 联系我们 开通白名单。
    部分媒体处理功能需获取您的原始文件,如您是用了 COS 防盗链功能,仅允许某些白名单地址可下载文件,请在白名单中添加 refer:ci.myqcloud.com
    内容审核服务 图片审核
  • 图片文件大小支持:支持审核32MB以下的图片,对于大小超过5MB的图片,您需要在调用请求时,使用 large-image-detect 参数。
  • 图片文件分辨率支持:不小于20 x 20,不大于10000 x 10000,建议分辨率大于256x256,否则可能会影响识别效果。
  • 图片文件支持格式:PNG、JPG、JPEG、BMP、GIF、WEBP 格式。
  • 视频审核
  • 视频文件大小支持:文件 < 5GB。
  • 视频文件支持格式:flv、mkv、mp4 、rmvb、avi、wmv、3gp、mov、m3u8、m4v 等。
  • 音频审核
  • 音频文件大小支持:文件 < 600MB。
  • 音频文件时长支持:< 3小时。
  • 音频码率类型支持:128Kbps - 256Kbps。
  • 音频文件支持格式:mp3、wav、aac、flac、amr、3gp、m4a、wma、ogg、ape。
  • 音频文件内容语言支持:普通话、英语、粤语。
  • 当输入为视频文件时,支持分离视频文件音轨,并对音频内容进行独立审核。
  • 文本审核
  • 支持直接审核文本内容:需先经过base64编码,文本编码前的原文长度不能超过10000个 utf8 编码字符。
  • 支持审核文本格式文件,例如 txt:仅支持 UTF8 编码和 GBK 编码,大小不能超过1MB。
  • 文本审核语言支持:目前支持中文、英文、阿拉伯数字的检测。
  • 网页审核 支持审核网页内的图片及文本。
    直播审核
  • 直播流时长支持:5小时以内。
  • 直播流分辨率支持:最大支持1920x1080 (1080p)。
  • 支持的直播流媒体协议:rmtp、hls、http、https 等主流协议。
  • 默认并发审核路数限制:10路,超过并发审核路数,接口会返回错误。
  • 内容识别服务 二维码识别图片标签识别 支持识别 png、jpeg、jpg 格式图片,图片大小不超过3MB,图片宽高大于50像素 x 50像素。
    语音识别
  • 支持中文普通话、英语和粤语的语音识别。
  • 识别格式:wav、mp3、m4a。
  • 普通 ASR 语音文件的时长不能大于5小时,文件大小不超过512MB。
  • 极速 ASR 仅支持100 MB以内且时长不超过2小时的音频文件。
  • 人脸特效 图片 base64 编码后大小不可超过5MB。支持 png、jpg、jpeg、bmp 格式,不支持 gif 图片。当使用人像分割时,图片分辨率须小于2000px × 2000px。
    身份证识别 要求图片经 base64 编码后不超过7M,分辨率建议500 × 800px以上,支持 png、jpg、jpeg、bmp 格式。建议卡片部分占据图片2/3以上。
    活体人脸核身 用于活体检测的视频 base64 编码后的大小不超过8M,支持 mp4、avi、flv 格式。
    文档处理 文档预览 1. 支持的输入文件类型包含如下格式:
  • 演示文件:pptx、ppt、pot、potx、pps、ppsx、dps、dpt、pptm、potm、ppsm。
  • 文字文件:doc、dot、wps、wpt、docx、dotx、docm、dotm。
  • 表格文件:xls、xlt、et、ett、xlsx、xltx、csv、xlsb、xlsm、xltm、ets。
  • 其他格式文件: pdf、 lrc、c、cpp、h、asm、 s、 java、asp、bat、bas、prg、cmd、rtf、txt、log、xml、htm、html。
    2. 支持预览200MB之内、5000页之内的文档。
  • 隐私合规保护 支持的输入文件类型包含如下格式:
  • Office 文件:doc、docx、ppt、pptx、xls、xlsx、rtf。
  • WPS 文件:wps、dps、et。
  • PDF 文件:pdf。
  • 纯文本文件:txt、xml、slk。
  • 网络文件:html、msg。
  • 邮件:eml、pst。
  • 队列与回调 回调重试策略 任务http回调超时或者返回状态码是非2xx时,会在连续重试2次,如果重试还是超时或者返回码还是非2xx时,则会以30min左右的间隔继续重试,如果48h内未重试成功,则不会再重试
    回调超时时间 单次回调超时时间为10s