有奖捉虫:办公协同&微信生态&物联网文档专题 HOT
腾讯云数据万象(Cloud Infinite)提供图片处理、媒体处理、内容审核、文件处理、AI 内容识别、文档服务等全品类多媒体数据的处理能力,为您提供专业一体化的数据处理解决方案,满足多种场景维度的需求。
本文列举了数据万象(Cloud Infinite)各处理能力所能提供的服务,请结合您的业务需求选用合适的服务。

图片处理

功能名称
详细描述
缩放
提供图片缩放功能,包括等比缩放、设定目标宽高缩放等。
裁剪
提供图片裁剪功能,包括普通裁剪、缩放裁剪、内切圆裁剪、圆角裁剪和人脸智能裁剪。
旋转
提供图片旋转功能,包括普通旋转和自适应旋转。
提供 JPG、PNG、GIF 等普通格式及 AVIF、HEIF、PSD 等高级格式的图片转换。
对图片的质量进行调节。
对图片进行模糊处理。
亮度
调节图片亮度。
对比度
调节图片对比度。
锐化
对图片进行锐化。
灰度图
将图片变成灰度图。
添加水印
对图片添加水印,包括 图片水印文字水印
去除图片元信息,包括 EXIF 信息。
数据万象提供缩略图功能,可快速实现图片格式转换、缩放、剪裁并生成缩略图。
数据万象提供可限制图片处理(例如缩放、压缩等)后的文件大小。
支持将基础图片处理操作设置为样式,用户可直接使用样式参数快速对图片进行处理。
在图片质量保持不变的情况,尽可能的减小图片大小,以达到节省图片存储空间、减少图片访问流量、提升图片访问速度的效果。
数据万象提供图片高级压缩功能,可以更加高效地将图片转换为 AVIF、HEIF 或 TPG 这类高压缩比的格式,有效降低图片传输链路及加载耗时,降低带宽及流量成本。
数据万象提供集成 AVIF、TPG 解码器的 iOSAndroid 终端 SDK,您只需在您的客户端进行集成,即可实现对 AVIF 和 TPG 的解码预览。
Guetzli 图片压缩是数据万象推出的视觉无损压缩服务,能够对 JPG、JPEG 图像进行高比例压缩,为使用者节省下载流量,加快下载速度,提升体验。
数据万象提供异常图片检测功能,能够检测出图片中是否隐含视频流等其他类型的可疑文件。
盲水印
盲水印功能是腾讯云数据万象提供的全新水印模式。通过该功能,您可将水印图以不可见的形式添加到原图信息中,且不会对原图质量产生太大影响。同时,在图片被盗取后,您可对疑似被盗取的资源进行盲水印提取,验证图片归属。
智能海报生产可根据设计模板自动替换素材、文案和 Logo 等信息,可快速生成海量广告素材。


媒体处理​

功能名称
详细说明
音视频转码提供音频、视频等媒体类文件的转码能力,是文件码流转换成另一个码流的过程。通过转码,可以改变原始码流的编码格式、分辨率和码率等参数,从而适应不同终端和网络环境的播放。
极速高清提供让视频更小更清晰的转码方式,能够保证网络资源低消耗,同时带给用户更佳的视觉体验。
音视频分段可按指定时长将音视频切分为若干片段,以提升您后期操作的效率,在分段时您还可以改变音视频片段的容器格式。
音视频拼接可将指定的音频片段拼接在音频文件的开头或结尾,生成一个新的音频文件,或者指定的视频片段拼接在视频文件的开头或结尾,生成一个新的视频文件。
自适应码流能够从单一原视频一次性生成多码率自适应的 HLS 或 DASH 目标文件,帮助用户在不同网络情况下快速分发视频内容。
视频转动图功能可将视频格式文件转为动图格式文件,您可选择视频指定时间段转换、视频抽帧方式、输出动图帧率、动图尺寸、动图格式等,满足不同场景下的动图需求。
视频编辑对音视频文件指定片段进行剪辑,生成一个新的视频,或拼接视频添加片头片尾合成新视频。
精彩集锦利用多模态内容理解技术,对视频的内容、动作姿态、场景进行多维度识别与聚合,以匹配专业编辑的水准迅速剪辑生成视频,例如进球瞬间、副歌高潮、综艺爆笑点等。
视频增强对视频进行综合分析与评估,借力 AI 技术提供细节增强、色彩增强、SDR to HDR 动态范围变换、超分辨率等功能,从各维度提升视频画质。
超分辨率识别视频的内容与轮廓高清重建视频的细节与局部特征,通过视频中一系列低分辨率的图像来得到一幅高分辨率的图像。
视频标签通过对视频中视觉、场景、行为、物体等信息进行分析,结合多模态信息融合及对齐技术,实现高准确率内容识别,自动输出视频的多维度内容标签。
视频元信息获取对于存储在对象存储中的视频、音频、字幕类媒体文件,您可获取其相关元信息,例如视频文件的编码格式、编码名称、像素格式、视频时长、码率、帧率、宽高等。
视频截帧为数据万象提供的视频某一时间节点的截图功能,可对截帧开始时间点、截帧间隔、截帧数量、输出图片尺寸、输出格式等进行自定义设置,满足多种截帧需求。
智能封面功能集成了腾讯云音视频实验室先进的 AI 技术,通过对视频内容的理解,智能分析视频帧的质量、精彩程度、内容相关度,提取最优帧生成截图作为封面,提升内容吸引力。
数字水印支持将图片、字符串隐藏在视频、图文中,不容易被探知和再次修改,并且具有不破坏视频与图文载体的完整性与可观赏性。通过隐藏在内容载体中的水印,可以达到确认内容创作者、版权所有者、传播者,判断视频内容是否被篡改的目的。
视频质量评分采用无参考评价方式对视频清晰度、信噪比、色彩、亮度等进行综合分析输出视频质量分值。


内容识别

功能名称
详细描述
二维码识别帮助用户检测图片中是否存在二维码,若存在则返回二维码位置及对应链接,并可对其进行覆盖操作。该功能能够有效解决违规插入二维码、恶意替换二维码等问题。
图片标签自动识别图片中的内容,并给出相关标签,可广泛应用于相册分类、信息流内容推荐、广告推荐、图库分类检索、视频内容理解、拍照识图等各种场景。
图片质量评估评估图片的视觉质量,从多个方面评估,并同时给出综合的、客观的清晰度评分,和主观的美观度评分。
人脸特效支持人脸美颜、人脸性别变换、人脸年龄变化、人像分割的特效功能,适用于社交娱乐、广告营销、互动传播等场景。
人脸核身集成了活体检测和跟权威库进行比对的能力,传入一段视频和姓名、身份证号信息即可进行验证。
汽车识别支持检测图片中的车辆,并识别出车辆的品牌、颜色、位置、车牌位置等信息。
通用文字识别功能(OCR)基于行业前沿的深度学习技术,将图片上的文字内容,智能识别为可编辑的文本,可应用于随手拍扫描、纸质文档电子化、电商广告审核等多种场景,大幅提升信息处理效率。
图像修复支持指定图像中需要修复的区域,并对其中的主体进行识别,通过 AI 算法智能填充与周围区域相似的图片纹理,适用于商业摄影后期、社交娱乐内容生产等场景。
商品抠图支持识别出图像中的商品主体,并对背景信息予以去除,获得透明底的商品素材,适用于电商海报智能生成、个性化商品推荐等功能。
LOGO 识别支持对图片内的电商 LOGO 进行识别,返回图片中 LOGO 的名称、坐标、置信度分值。
词性分析为各类企业及开发者提供的用于文本分析及挖掘的能力,可帮助用户高效地处理文本,可实现分词与词性标注。
人体识别可自动检测识别图像中人体的信息,识别每个人体的位置。
内容翻译提供多语言翻译能力,可应用于跨境电商、教育、医疗、金融、制造等行业。支持文本、文档、图片各类格式翻译。
图像超分将低分辨率图像重建为高分辨率图像。
对视频内容进行综合分析后输出人像区域结果视频。
对输入图像进行分析,使用智能重建技术,对低质图像进行综合增强,大幅度地提高整体画面清晰度,对模糊图像进行智能快速去噪,使画面更加自然清晰。
智能分析图像内容,一键为人像、风景、动物各类场景的黑白图片重新上色。
输入一张图片,智能分析图像主体内容,对图像进行裁剪以适配不同尺寸要求。

内容审核

功能名称
详细说明
图片审核功能可帮助用户有效识别图片中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的图片安全。
视频审核功能可帮助用户有效识别视频画面中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
音频审核功能可帮助用户有效识别音频中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
文本审核功能可帮助用户有效检测文本文件中的违禁内容,可以检测涉黄、违法违规、广告、违法、谩骂等可能令人不适的内容。目前支持机器自动审核和专业团队人工复审,全方位保障平台的安全。
文档审核可提取文档内容结合图片、文本内容审核的能力,对文档中的图片、文字等内容进行识别过滤,检测场景包括鉴黄、违法违规检测、广告检测。
网页审核提取网页中的内容,结合图片、文本内容审核的能力,对网页中的图片、文字等内容进行识别过滤,检测场景包括鉴黄、违法违规检测、广告检测。
直播审核功能可帮助用户有效识别直播画面中的违禁内容,检测场景包括鉴黄、违法违规检测、广告检测。

文档处理

功能名称
详细说明
文档预览支持近30多种类型文件以图片或 HTML 格式的预览,最大程度保留在线浏览时源文档样式,解决不同终端对某些文档类型不支持的问题,满足 PC、App 等多端的文档在线浏览需求。
隐私合规保护提供文本隐私筛查服务,可对文本文件中身份证号、纳税人识别号、工商注册号、军官证、电子邮箱、车牌号、手机号类型的隐私数据进行筛查,防止信息泄露。

文件处理

功能名称
详细说明
哈希值计算即计算文件的哈希值,当前支持的哈希值算法有 MD5、SHA1、SHA256。
文件解压缩支持对压缩包文件进行云上解压,解压后转存至 COS。
多文件打包压缩支持对多个文件进行打包压缩,当前支持打包为 zip、tar、tar.gz 格式。

智能语音

功能名称
详细说明
语音合成通过先进的深度学习技术,将文本转换成自然流畅的语音。
语音识别是针对已经录制完成的录音文件,进行识别的服务,异步返回识别文本,可应用于呼叫中心语音质检、视频字幕生成,会议语音资料转写等场景。
人声分离能够将同一素材中的人声与背景音分离开来生成新的独立音频文件。
音频降噪适用于录制课程、户外拍摄后期等情况为音频去除设备底噪、环境噪声等。
听歌识曲将音频指纹信息发送给云端数据进行大数据扩展搜索。

智能工具箱

智能工具箱 将 CI 数据万象各类 AI 云原生能力进行可视化呈现,即开即用,打开 智能工具箱页面 即可使用各类图片工具、视频工具、音频工具、文档工具,简单快捷,支持批量操作,适配各类内容生产业务。