音视频增强功能依托业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。
创建增强模板
说明:
增强功能基于转码实现,即在转码处理基础上叠加增强参数。使用增强功能时,需同时配置转码参数和增强参数,建议配合极速高清转码使用。
在转码模板中配置增强参数:您可以通过调用 服务端 API 创建和管理自定义增强模板。
在转自适应码流模板中配置增强参数:您可以调用 服务端 API 创建和管理自定义增强模板。
视频增强参数
配置项 | 描述 | |
适用视频场景 | | 我们为 AIGC、短剧、短视频、游戏视频、高清影视剧等场景预设了推荐参数。点击不同场景,MPS 将为您自动配置增强能力,并调整底层处理模型,从而获得更好的增强效果。您也可以在推荐参数基础上微调。 |
基础画质增强 | 大模型增强 | 基于 Diffusion 大模型,利用其强大的 AI 生成能力,显著提升视频画质修复效果,效果远超常规方法,尤其适合修复老旧视频。 |
| 综合增强 | 通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。 |
| 去毛刺增强 | 去毛刺技术通过分析编码信息,智能去除伪影,修复画面毛刺、模糊或颜色不自然问题,恢复画面清晰度和自然度,从而提升视频整体质量。 |
| 说明: 以上三种能力属于最常用的基础画质增强功能,画质提升效果排序为:大模型增强 > 综合增强 > 去毛刺增强,支持三选一或不开启。 | |
扩展增强能力 | 智能插帧 | 开启后,若设置的插帧帧率比源文件帧率高,将通过分析相邻帧之间的运动,智能生成中间帧,给用户提供更加流畅丝滑的视觉效果。 插帧帧率限制在 [1, 120]。 |
| 超分辨率 | 超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。支持选择:低清晰度模型、高清晰度模型(默认)。 低清晰度模型:低清晰度模型专注于处理低分辨率的视频帧,主要目标是从这些低分辨率的帧中恢复细节和信息。该模型速度较快,适合用于快速处理视频。 高清晰度模型(默认):高清晰度模型旨在生成更高质量的高分辨率视频帧,通过学习从低分辨率到高分辨率的映射来实现。该模型更复杂,需要更多计算资源,但通常能够产生更清晰、更真实的视频帧。 |
| HDR | 支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。 HDR10:是一种静态 HDR 标准,提供更广泛的色彩和亮度范围。 HLG(Hybrid Log-Gamma):结合了 SDR 和 HDR 的优点,允许同一视频流同时包含 SDR 和 HDR 的信息,适用于广播和流媒体应用。 注意:编码标准为 H.264/H.265 才能开启 HDR。 |
| 低光照增强 | 因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。 |
| 色彩增强 | 旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。 |
| 视频降噪 | 影片拍摄中会因为相机和环境引入随机噪点,视频降噪服务能够在保持细节不损失的情况下,消除画面中的随机噪声。 |
| 去划痕 | 去划痕可以修复视频中的划痕和雪花点等被破坏的内容。 |
| 说明: 请根据原始视频的实际问题,开启所需的扩展增强功能。 请勿开启所有功能或叠加视频实际不需要的能力,以免产生负面影响。 | |
音频增强参数
配置项 | 描述 |
音频降噪 | 通过智能算法识别并消除背景噪声,同时保留并增强人声或主音信号,显著提升音频清晰度和听觉体验。 |
音频分离 | 分离音视频文件中人声与背景声,或者演唱声和伴奏声,便于实现其他后期加工。 |
音量均衡 | 智能识别并调整音量,避免出现过于响亮、过于安静或音量突变的问题,提供更好的听觉体验。 |
音频美化 | 智能美化音频,去除杂音、压制尖锐刺耳等不自然齿音,改善音频质量。 |
任务发起
以下是各种方式发起转码任务的说明:
调用服务端 API ProcessMedia 发起任务:在请求中的
MediaProcessTask.TranscodeTaskSet参数指定 转码模板 的模板 ID。控制台上传:在控制台 添加任务流,任务流中设置目标转码规格;通过控制台上传视频,选择 上传的同时对视频进行处理操作 并指定视频上传后执行该任务流。
结果获取
{"EventType":"ProcedureStateChanged","ProcedureStateChangeEvent":{"TaskId":"1256768367-Procedure-2e1af2456351812be963e309cc133403t0","Status":"FINISH","FileId":"52858**********9930","FileName":"动物世界","FileUrl":"http://1256768367.vod2.myqcloud.com/xxx/xxx/AtUCmy6gmIYA.mp4","MetaData":{"AudioDuration":60,"AudioStreamSet":[{"Bitrate":383854,"Codec":"aac","SamplingRate":48000}],"Bitrate":1021028,"Container":"mov,mp4,m4a,3gp,3g2,mj2","Duration":60,"Height":480,"Rotate":0,"Size":7700180,"VideoDuration":60,"VideoStreamSet":[{"Bitrate":637174,"Codec":"h264","Fps":23,"Height":480,"Width":640}],"Width":640},"MediaProcessResultSet":[{"Type":"Transcode","TranscodeTask":{"Status":"SUCCESS","ErrCode":0,"Message":"","Input":{"Definition":220},"Output":{"Url":"http://1256768367.vod2.myqcloud.com/xxx/xxx/v.f20.m3u8","Size":63120997,"Container":"mov,mp4,m4a,3gp,3g2,mj2","Height":480,"Width":640,"Bitrate":513402,"Md5":"084d403c73930ca2f8**********7bd3","Duration":60,"VideoStreamSet":[{"Bitrate":473101,"Codec":"h264","Fps":24,"Height":480,"Width":640}],"AudioStreamSet":[{"Bitrate":48581,"Codec":"aac","SamplingRate":44100}],"Definition":220}}}],"TasksPriority":0,"TasksNotifyMode":""}}
回调结果中,
ProcedureStateChangeEvent.MediaProcessResultSet有一个Type为Transcode类型的转码结果,Definition为220。