API 文档

SDK 文档

诚邀爱技术、爱分享的你,成为文档内容共建者> HOT

数据万象支持的功能及说明如下:

分类 功能 说明
基础图片处理服务 缩放 提供图片缩放功能,包括等比缩放、设定目标宽高缩放等。
裁剪 提供图片裁剪功能,包括普通裁剪、缩放裁剪、内切圆裁剪、圆角裁剪和人脸智能裁剪。
旋转 提供图片旋转功能,包括普通旋转和自适应旋转。
格式转换 提供格式转换、gif 格式优化、渐进显示功能。
质量变换 针对 JPG 和 WEBP 图片进行质量变换。
高斯模糊 对图片进行模糊处理。
亮度 调节图片亮度。
对比度 调节图片对比度。
锐化 对图片进行锐化处理。
添加水印 对图片添加水印,包括 图片水印文字水印
获取图片信息 支持获取 图片基本信息图片 EXIF主色调信息
去除元信息 去除图片元信息,包括 EXIF 信息。
快速缩略模板 数据万象提供缩略图功能,可快速实现图片格式转换、缩放、剪裁并生成缩略图。
限制图片大小 数据万象提供可限制图片处理(例如缩放、压缩等)后的文件大小。
样式设置 支持将基础图片处理操作设置为样式,用户可直接使用样式参数快速对图片进行处理。
图片增值服务 Guetzli 图片压缩 Guetzli 图片压缩是数据万象推出的视觉无损压缩服务,能够对 JPG、JPEG 图像进行高比例压缩,为使用者节省下载流量,加快下载速度,提升体验。
图片高级压缩 数据万象提供图片高级压缩功能,可以更加高效地将图片转换为 TPG 或 HEIF 等高压缩比格式,有效降低图片传输链路及加载耗时,降低带宽及流量成本。
异常图片检测 数据万象提供异常图片检测功能,能够检测出图片中是否隐含视频流等其他类型的可疑文件。
盲水印 盲水印功能是腾讯云数据万象提供的全新水印模式。通过该功能,您可将水印图以不可见的形式添加到原图信息中,且不会对原图质量产生太大影响。同时,在图片被盗取后,您可对疑似被盗取的资源进行盲水印提取,验证图片归属。
媒体处理服务 视频截帧 视频截帧为数据万象提供的视频某一时间节点的截图功能,可对截帧开始时间点、截帧间隔、截帧数量、输出图片尺寸、输出格式等进行自定义设置,满足多种截帧需求。
视频转动图 数据万象视频转动图功能可将视频格式文件转为动图格式文件,您可选择视频指定时间段转换、视频抽帧方式、输出动图帧率、动图尺寸、动图格式等,满足不同场景下的动图需求。
智能封面 数据万象智能封面功能集成了腾讯云音视频实验室先进的 AI 技术,通过对视频内容的理解,智能分析视频帧的质量、精彩程度、内容相关度,提取最优帧生成截图作为封面,提升内容吸引力。
音视频转码 音视频转码提供音频、视频等媒体类文件的转码能力,是文件码流转换成另一个码流的过程。通过转码,可以改变原始码流的编码格式、分辨率和码率等参数,从而适应不同终端和网络环境的播放。
转封装(音视频分段) 音视频分段可按指定时长将音视频切分为若干片段,以提升您后期操作的效率,在分段时您还可以改变音视频片段的容器格式。
视频编辑 对音视频文件指定片段进行剪辑,生成一个新的视频,或拼接视频添加片头片尾合成新视频。
极速高清 极速高清提供让视频更小更清晰的转码方式,能够保证网络资源低消耗,同时带给用户更佳的视觉体验。
自适应码流 自适应码流能够从单一原视频一次性生成多码率自适应的 HLS 或 DASH 目标文件,帮助用户在不同网络情况下快速分发视频内容。
超分辨率 超分辨率识别视频的内容与轮廓高清重建视频的细节与局部特征,通过视频中一系列低分辨率的图像来得到一幅高分辨率的图像。
视频增强 视频增强对视频进行综合分析与评估,借力 AI 技术提供细节增强、色彩增强、SDR to HDR 动态范围变换、超分辨率等功能,从各维度提升视频画质。
精彩集锦 利用多模态内容理解技术,对视频的内容、动作姿态、场景进行多维度识别与聚合,以匹配专业编辑的水准迅速剪辑生成视频,例如进球瞬间、副歌高潮、综艺爆笑点等。
数字水印 数据万象支持将图片、字符串隐藏在视频、图文中,不容易被探知和再次修改,并且具有不破坏视频与图文载体的完整性与可观赏性。通过隐藏在内容载体中的水印,可以达到确认内容创作者、版权所有者、传播者,判断视频内容是否被篡改的目的。
视频标签 视频标签通过对视频中视觉、场景、行为、物体等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签。
视频质量评分 采用无参考评价方式对视频清晰度、信噪比、色彩、亮度等进行综合分析输出视频质量分值。
视频元信息获取 对于存储在对象存储中的视频、音频、字幕类媒体文件,您可获取其相关元信息,例如视频文件的编码格式、编码名称、像素格式、视频时长、码率、帧率、宽高等。
音视频拼接 音视频拼接可将指定的音频片段拼接在音频文件的开头或结尾,生成一个新的音频文件,或者指定的视频片段拼接在视频文件的开头或结尾,生成一个新的视频文件。
智能语音服务
语音合成 语音合成通过先进的深度学习技术,将文本转换成自然流畅的语音。
语音识别 语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。
人声分离 人声分离能够将同一素材中的人声与背景音分离开来生成新的独立音频文件。
音频降噪 音频降噪适用于录制课程、户外拍摄后期等情况为音频去除设备底噪、环境噪声等。
内容审核服务 图片审核 图片审核功能可帮助用户有效识别图片中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的图片安全。
视频审核 视频审核功能可帮助用户有效识别视频画面中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
音频审核 音频审核功能可帮助用户有效识别音频中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
文本审核 文本审核功能可帮助用户有效检测文本文件中的违禁内容,可以检测涉黄、违法违规、广告、违法、谩骂等可能令人不适的内容。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
内容识别服务 图片识别 提供 二维码识别图片标签识别 功能。
商品抠图 支持识别出图像中的商品主体,并对背景信息予以去除,获得透明底的商品素材,适用于电商海报智能生成、个性化商品推荐等功能。
图像修复 支持指定图像中需要修复的区域,并对其中的主体进行识别,通过 AI 算法智能填充与周围区域相似的图片纹理,适用于商业摄影后期、社交娱乐内容生产等场景。
LOGO 识别 支持对图片内的电商 Logo 进行识别,返回图片中 Logo 的名称、坐标、置信度分值。
车辆车牌检测 支持检测图片中的车辆,并识别出车辆的品牌、颜色、位置、车牌位置等信息。
通用文字识别 通用文字识别功能(OCR)基于行业前沿的深度学习技术,将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
以图搜图 可对图片库内的图片进行特征提取、对比和搜索,适用于电商产品搜索、版权保护等场景。
人脸特效 人脸特效支持人脸美颜、人脸性别变换、人脸年龄变化、人像分割的特效功能,适用于社交娱乐、广告营销、互动传播等场景。
身份证识别 支持中国大陆居民二代身份证正反面所有字段的识别,包括姓名、性别、民族、出生日期、住址、公民身份证号、签发机关、有效期限;具备身份证照片、人像照片的裁剪功能和翻拍、PS、复印件告警功能,以及边框和框内遮挡告警、临时身份证告警和身份证有效期不合法告警等扩展功能。
活体人脸核身 集成了活体检测和跟权威库进行比对的能力,传入一段视频和姓名、身份证号信息即可进行验证。
文档处理服务 文档预览 文档预览支持近30多种类型文件以图片或 HTML 格式的预览,最大程度保留在线浏览时源文档样式,解决不同终端对某些文档类型不支持的问题,满足 PC、App 等多端的文档在线浏览需求。
隐私合规保护 数据万象隐私合规保护提供文本隐私筛查服务,可对文本文件中身份证号、纳税人识别号、工商注册号、军官证、电子邮箱、车牌号、手机号类型的隐私数据进行筛查,防止信息泄露。