音视频增强

最近更新时间:2026-02-02 10:49:31

我的收藏

音视频增强功能简介

概述

音视频增强功能依托业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。

技术优势

全场景 AI 增强算法。针对游戏、UGC 内容、PGC 高清影视、在线教育、秀场、电商、老旧片源等不同场景定制行业领先的 AI 增强算法,全面提高音频和视频质量。
全面音频增强。支持语音降噪、音频分离、音质增强、音量均衡,显著提升音频清晰度和质量,满足各类场景下对高品质音频的需求。


计费详情

音视频增强功能基于转码实现,即增强处理是在转码处理基础上叠加增强参数。因此使用增强功能时,需要同时配置普通转码或极速高清转码参数和增强参数,收取转码和增强费用。
增强计费方式参见 音视频增强计费
转码计费方式参见 普通转码计费极速高清转码计费

视频增强能力

能力
描述
基础画质增强
大模型增强
基于 Diffusion 大模型,利用其强大的 AI 生成能力,显著提升视频画质修复效果,效果远超常规方法,尤其适合修复老旧视频。
综合增强
通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。
去毛刺增强
去毛刺技术通过分析编码信息,智能去除伪影,修复画面毛刺、模糊或颜色不自然问题,恢复画面清晰度和自然度,从而提升视频整体质量。
扩展增强能力
智能插帧
开启后,若设置的插帧帧率比源文件帧率高,将通过分析相邻帧之间的运动,智能生成中间帧,给用户提供更加流畅丝滑的视觉效果。
超分辨率
超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。
HDR
支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。
低光照增强
因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。
色彩增强
旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。
视频降噪
影片拍摄中会因为相机和环境引入随机噪点,视频降噪服务能够在保持细节不损失的情况下,消除画面中的随机噪声。
去划痕
去划痕可以修复视频中的划痕和雪花点等被破坏的内容。

音频增强能力

能力
描述
音频降噪
通过智能算法识别并消除背景噪声,同时保留并增强人声或主音信号,显著提升音频清晰度和听觉体验。
音频分离
分离音视频文件中人声与背景声,或者演唱声和伴奏声,便于实现其他后期加工。
音量均衡
智能识别并调整音量,避免出现过于响亮、过于安静或音量突变的问题,提供更好的听觉体验。
音频美化
智能美化音频,去除杂音、压制尖锐刺耳等不自然齿音,改善音频质量。

适用场景

音视频增强适用于 UGC/PGC 视频质量提升、游戏直播录制、老片翻新、低分辨率超分增强等业务场景。
场景
说明
UGC/PGC
视频质量提升
通过人脸增强技术,在消除人脸整体的模糊和压缩损伤的同时,进一步对人脸关键的五官重建,对眼睛、嘴巴、耳朵、皮肤甚至发丝都进行了细节重建和纹理添加,显著增加面部细节和质感。
游戏直播录制
直播流录制前通常会先进行转码,以解决由于断流等导致录制文件异常的问题,但是转码过程产生视频压缩会导致画面效果失真、模糊,该模板主要进行去压缩失真修复,较好地还原画面细节,提升视觉效果。
老片翻新
部分老片受限于当时拍摄的技术,可能出现大量的伪影、划痕等,画质较差。利用画质重生的修复和增强能力,将老片翻新,让老片「焕发新生」。
低分辨率超分
受限于拍摄条件、存储成本等因素,有的存档视频以较低分辨率存储,如今需要在较高显示设备播放,如果直接将低分辨率视频转码为高分辨率视频,视频画面会更模糊。通过云点播画质重生超分,结合低画质修复、关键细节增强等 AI 处理,确保超分后视频具有较高的画质。

使用方式

相关 API 如下:
1. 发起音视频增强任务,具体请参见 任务发起
2. 获取音视频增强的结果,具体请参见 查询任务详情拉取事件通知
详细开发指南请参见 音视频增强