生成式场景

最近更新时间:2025-03-11 16:34:52

我的收藏

概述

大模型音视频内容生成,需要海量的高质量训练素材。当前的行业竞争趋势也向着提供更高清晰度,更流畅,更真实的 AIGC 内容发展。在该场景下,腾讯云音视频将自身质检、音视频增强、画面超分技术,与生成式场景深入结合,极大提升了生成结果的质量。

生成式场景核心需求

在视频训练素材收集和清洗阶段,需要能够甄别质量不佳的视频信息,将问题视频分拣。
需要提升生成视频的分辨率,帧率,色彩效果,让画面更清晰流畅。
对生成的结果添加必要的水印信息,满足信息溯源和合规要求。

我们提供的解决方案

在图像和视频大模型训练和生成场景,也融合了腾讯云音视频丰富的技术能力。
在视频训练数据清洗环节,通过媒体质检能力,可以将存在格式问题和画面问题的训练素材剔除,提升训练视频的整理质量。
在视频生成场景,视频超分能力可以将 AI 生成的视频清晰度进一步提升,并可以通过智能补帧能力获得更加流畅的画面效果。
为大模型生成结果添加浮现式水印和隐藏式水印。

功能
功能说明
如何接入
媒体质检
媒体质检支持:
格式质检
视频&音频内容质检
无参考评分
该功能在模型训练素材清洗阶段,可以检测视频格式问题,并可以识别画面问题如色彩失真、低光照、暗角、对比度异常、重影、马赛克等问题。通过质检剔除问题视频后,整体训练素材的内容质量会显著提升。
参见 媒体质检接入 文档。
音视频增强
音视频增强功能,可以提供视频去模糊、降噪、细节增强、文字增强、色彩增强、人脸增强、视频超分、视频插帧等能力。
在大模型视频生成场景,能够将原始生成的720P或者1080P分辨率的视频,超分成2K、4K分辨率,并可以通过插帧、细节增强、色彩增强等功能进一步提升画面质量。
参见 发起媒体处理 文档。
视频水印
支持为视频添加浮现式水印(明水印)和隐藏式水印(暗水印),满足信息溯源和合规要求。
支持自定义水印样式如水印图片、水印位置、水印大小等。