音视频增强

最近更新时间:2026-02-03 17:57:11

我的收藏
音视频增强功能依托业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。

创建增强模板

说明:
增强功能基于转码实现,即在转码处理基础上叠加增强参数。使用增强功能时,需同时配置转码参数和增强参数,建议配合极速高清转码使用。
在转码模板中配置增强参数:您可以通过调用 服务端 API 创建和管理自定义增强模板。
在转自适应码流模板中配置增强参数:您可以调用 服务端 API 创建和管理自定义增强模板。

视频增强参数

配置项
描述
适用视频场景
我们为 AIGC、短剧、短视频、游戏视频、高清影视剧等场景预设了推荐参数。点击不同场景,MPS 将为您自动配置增强能力,并调整底层处理模型,从而获得更好的增强效果。您也可以在推荐参数基础上微调。
基础画质增强
大模型增强
基于 Diffusion 大模型,利用其强大的 AI 生成能力,显著提升视频画质修复效果,效果远超常规方法,尤其适合修复老旧视频。
综合增强
通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。
去毛刺增强
去毛刺技术通过分析编码信息,智能去除伪影,修复画面毛刺、模糊或颜色不自然问题,恢复画面清晰度和自然度,从而提升视频整体质量。
说明:
以上三种能力属于最常用的基础画质增强功能,画质提升效果排序为:大模型增强 > 综合增强 > 去毛刺增强,支持三选一或不开启。
扩展增强能力
智能插帧
开启后,若设置的插帧帧率比源文件帧率高,将通过分析相邻帧之间的运动,智能生成中间帧,给用户提供更加流畅丝滑的视觉效果。
插帧帧率限制在 [1, 120]。
超分辨率
超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。支持选择:低清晰度模型、高清晰度模型(默认)。
低清晰度模型:低清晰度模型专注于处理低分辨率的视频帧,主要目标是从这些低分辨率的帧中恢复细节和信息。该模型速度较快,适合用于快速处理视频。
高清晰度模型(默认):高清晰度模型旨在生成更高质量的高分辨率视频帧,通过学习从低分辨率到高分辨率的映射来实现。该模型更复杂,需要更多计算资源,但通常能够产生更清晰、更真实的视频帧。
HDR
支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。
HDR10:是一种静态 HDR 标准,提供更广泛的色彩和亮度范围。
HLG(Hybrid Log-Gamma):结合了 SDR 和 HDR 的优点,允许同一视频流同时包含 SDR 和 HDR 的信息,适用于广播和流媒体应用。

注意:编码标准为 H.264/H.265 才能开启 HDR。
低光照增强
因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。
色彩增强
旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。
视频降噪
影片拍摄中会因为相机和环境引入随机噪点,视频降噪服务能够在保持细节不损失的情况下,消除画面中的随机噪声。
去划痕
去划痕可以修复视频中的划痕和雪花点等被破坏的内容。
说明:
请根据原始视频的实际问题,开启所需的扩展增强功能。
请勿开启所有功能或叠加视频实际不需要的能力,以免产生负面影响。

音频增强参数

配置项
描述
音频降噪
通过智能算法识别并消除背景噪声,同时保留并增强人声或主音信号,显著提升音频清晰度和听觉体验。
音频分离
分离音视频文件中人声与背景声,或者演唱声和伴奏声,便于实现其他后期加工。
音量均衡
智能识别并调整音量,避免出现过于响亮、过于安静或音量突变的问题,提供更好的听觉体验。
音频美化
智能美化音频,去除杂音、压制尖锐刺耳等不自然齿音,改善音频质量。

任务发起

发起转码任务,有“通过服务端 API 直接发起”,“通过控制台直接发起”和“上传时指定要执行的任务”三种方式。具体请参照视频处理的 任务发起
以下是各种方式发起转码任务的说明:
调用服务端 API ProcessMedia 发起任务:在请求中的MediaProcessTask.TranscodeTaskSet参数指定 转码模板 的模板 ID。
通过控制台对视频发起任务:在控制台 添加任务流,任务流中设置目标转码规格;在控制台使用该任务流 发起视频处理
服务端上传时指定任务:在控制台 添加任务流,任务流中设置目标转码规格;申请上传 中的procedure参数指定为该任务流。
客户端上传时指定任务:在控制台 添加任务流,任务流中设置目标转码规格;在 客户端上传签名 中的procedure指定该任务流。
控制台上传:在控制台 添加任务流,任务流中设置目标转码规格;通过控制台上传视频,选择 上传的同时对视频进行处理操作 并指定视频上传后执行该任务流。

结果获取

发起转码任务后,您可以通过异步等待 结果通知 和同步进行 任务查询 两种方式获取转码的执行结果。下面是发起转码任务后,普通回调方式下结果通知的示例(省略了值为 null 的字段):
{
"EventType":"ProcedureStateChanged",
"ProcedureStateChangeEvent":{
"TaskId":"1256768367-Procedure-2e1af2456351812be963e309cc133403t0",
"Status":"FINISH",
"FileId":"52858**********9930",
"FileName":"动物世界",
"FileUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/AtUCmy6gmIYA.mp4",
"MetaData":{
"AudioDuration":60,
"AudioStreamSet":[
{
"Bitrate":383854,
"Codec":"aac",
"SamplingRate":48000
}
],
"Bitrate":1021028,
"Container":"mov,mp4,m4a,3gp,3g2,mj2",
"Duration":60,
"Height":480,
"Rotate":0,
"Size":7700180,
"VideoDuration":60,
"VideoStreamSet":[
{
"Bitrate":637174,
"Codec":"h264",
"Fps":23,
"Height":480,
"Width":640
}
],
"Width":640
},
"MediaProcessResultSet":[
{
"Type":"Transcode",
"TranscodeTask":{
"Status":"SUCCESS",
"ErrCode":0,
"Message":"",
"Input":{
"Definition":220
},
"Output":{
"Url":"http://1256768367.vod2.myqcloud.com/xxx/xxx/v.f20.m3u8",
"Size":63120997,
"Container":"mov,mp4,m4a,3gp,3g2,mj2",
"Height":480,
"Width":640,
"Bitrate":513402,
"Md5":"084d403c73930ca2f8**********7bd3",
"Duration":60,
"VideoStreamSet":[
{
"Bitrate":473101,
"Codec":"h264",
"Fps":24,
"Height":480,
"Width":640
}
],
"AudioStreamSet":[
{
"Bitrate":48581,
"Codec":"aac",
"SamplingRate":44100
}
],
"Definition":220
}
}
}
],
"TasksPriority":0,
"TasksNotifyMode":""
}
}
回调结果中,ProcedureStateChangeEvent.MediaProcessResultSet有一个TypeTranscode类型的转码结果,Definition为220。