媒体处理生成式场景

概述
大模型音视频内容生成，需要海量的高质量训练素材。当前的行业竞争趋势也向着提供更高清晰度，更流畅，更真实的 AIGC 内容发展。在该场景下，腾讯云音视频将自身质检、音视频增强、画面超分技术，与生成式场景深入结合，极大提升了生成结果的质量。
生成式场景核心需求
在视频训练素材收集和清洗阶段，需要能够甄别质量不佳的视频信息，将问题视频分拣。
需要提升生成视频的分辨率，帧率，色彩效果，让画面更清晰流畅。
对生成的结果添加必要的水印信息，满足信息溯源和合规要求。
我们提供的解决方案
在图像和视频大模型训练和生成场景，也融合了腾讯云音视频丰富的技术能力。
在视频训练数据清洗环节，通过媒体质检能力，可以将存在格式问题和画面问题的训练素材剔除，提升训练视频的整理质量。
在视频生成场景，视频超分能力可以将 AI 生成的视频清晰度进一步提升，并可以通过智能补帧能力获得更加流畅的画面效果。
为大模型生成结果添加浮现式水印和隐藏式水印。
﻿
功能
功能说明
如何接入
媒体质检
媒体质检支持：
格式质检
视频&音频内容质检
无参考评分 
该功能在模型训练素材清洗阶段，可以检测视频格式问题，并可以识别画面问题如色彩失真、低光照、暗角、对比度异常、重影、马赛克等问题。通过质检剔除问题视频后，整体训练素材的内容质量会显著提升。
参见 媒体质检接入 文档。
音视频增强
音视频增强功能，可以提供视频去模糊、降噪、细节增强、文字增强、色彩增强、人脸增强、视频超分、视频插帧等能力。
在大模型视频生成场景，能够将原始生成的720P或者1080P分辨率的视频，超分成2K、4K分辨率，并可以通过插帧、细节增强、色彩增强等功能进一步提升画面质量。
参见 发起媒体处理 文档。
视频水印
支持为视频添加浮现式水印（明水印）和隐藏式水印（暗水印），满足信息溯源和合规要求。
支持自定义水印样式如水印图片、水印位置、水印大小等。
﻿
﻿

功能	功能说明	如何接入
媒体质检	媒体质检支持：格式质检视频&音频内容质检无参考评分该功能在模型训练素材清洗阶段，可以检测视频格式问题，并可以识别画面问题如色彩失真、低光照、暗角、对比度异常、重影、马赛克等问题。通过质检剔除问题视频后，整体训练素材的内容质量会显著提升。	参见媒体质检接入文档。
音视频增强	音视频增强功能，可以提供视频去模糊、降噪、细节增强、文字增强、色彩增强、人脸增强、视频超分、视频插帧等能力。在大模型视频生成场景，能够将原始生成的720P或者1080P分辨率的视频，超分成2K、4K分辨率，并可以通过插帧、细节增强、色彩增强等功能进一步提升画面质量。	参见发起媒体处理文档。
视频水印	支持为视频添加浮现式水印（明水印）和隐藏式水印（暗水印），满足信息溯源和合规要求。支持自定义水印样式如水印图片、水印位置、水印大小等。	参见发起媒体处理文档。

生成式场景

本页目录：

概述

生成式场景核心需求

我们提供的解决方案