音视频增强功能简介
概述
音视频增强功能依托业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。
技术优势
全场景 AI 增强算法。针对游戏、UGC 内容、PGC 高清影视、在线教育、秀场、电商、老旧片源等不同场景定制行业领先的 AI 增强算法,全面提高音频和视频质量。
全面音频增强。支持语音降噪、音频分离、音质增强、音量均衡,显著提升音频清晰度和质量,满足各类场景下对高品质音频的需求。

计费详情
音视频增强功能基于转码实现,即增强处理是在转码处理基础上叠加增强参数。因此使用增强功能时,需要同时配置普通转码或极速高清转码参数和增强参数,收取转码和增强费用。
增强计费方式参见 音视频增强计费。
视频增强能力
能力 | 描述 | |
基础画质增强 | 大模型增强 | 基于 Diffusion 大模型,利用其强大的 AI 生成能力,显著提升视频画质修复效果,效果远超常规方法,尤其适合修复老旧视频。 |
| 综合增强 | 通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。 |
| 去毛刺增强 | 去毛刺技术通过分析编码信息,智能去除伪影,修复画面毛刺、模糊或颜色不自然问题,恢复画面清晰度和自然度,从而提升视频整体质量。 |
扩展增强能力 | 智能插帧 | 开启后,若设置的插帧帧率比源文件帧率高,将通过分析相邻帧之间的运动,智能生成中间帧,给用户提供更加流畅丝滑的视觉效果。 |
| 超分辨率 | 超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。 |
| HDR | 支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。 |
| 低光照增强 | 因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。 |
| 色彩增强 | 旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。 |
| 视频降噪 | 影片拍摄中会因为相机和环境引入随机噪点,视频降噪服务能够在保持细节不损失的情况下,消除画面中的随机噪声。 |
| 去划痕 | 去划痕可以修复视频中的划痕和雪花点等被破坏的内容。 |
音频增强能力
能力 | 描述 |
音频降噪 | 通过智能算法识别并消除背景噪声,同时保留并增强人声或主音信号,显著提升音频清晰度和听觉体验。 |
音频分离 | 分离音视频文件中人声与背景声,或者演唱声和伴奏声,便于实现其他后期加工。 |
音量均衡 | 智能识别并调整音量,避免出现过于响亮、过于安静或音量突变的问题,提供更好的听觉体验。 |
音频美化 | 智能美化音频,去除杂音、压制尖锐刺耳等不自然齿音,改善音频质量。 |
适用场景
音视频增强适用于 UGC/PGC 视频质量提升、游戏直播录制、老片翻新、低分辨率超分增强等业务场景。
场景 | 说明 |
UGC/PGC 视频质量提升 | 通过人脸增强技术,在消除人脸整体的模糊和压缩损伤的同时,进一步对人脸关键的五官重建,对眼睛、嘴巴、耳朵、皮肤甚至发丝都进行了细节重建和纹理添加,显著增加面部细节和质感。 |
游戏直播录制 | 直播流录制前通常会先进行转码,以解决由于断流等导致录制文件异常的问题,但是转码过程产生视频压缩会导致画面效果失真、模糊,该模板主要进行去压缩失真修复,较好地还原画面细节,提升视觉效果。 |
老片翻新 | 部分老片受限于当时拍摄的技术,可能出现大量的伪影、划痕等,画质较差。利用画质重生的修复和增强能力,将老片翻新,让老片「焕发新生」。 |
低分辨率超分 | 受限于拍摄条件、存储成本等因素,有的存档视频以较低分辨率存储,如今需要在较高显示设备播放,如果直接将低分辨率视频转码为高分辨率视频,视频画面会更模糊。通过云点播画质重生超分,结合低画质修复、关键细节增强等 AI 处理,确保超分后视频具有较高的画质。 |
使用方式
相关 API 如下:
1. 发起音视频增强任务,具体请参见 任务发起。