云点播音视频增强

音视频增强功能简介
概述
音视频增强功能依托业界领先的音视频 AI 处理模型和丰富的业务数据积累，提供专业级音视频增强解决方案。该功能支持分布式实时画质增强，包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能，可大幅提升音视频质量，广泛应用于 OTT、电商、赛事等场景，有效实现 QoE 与 QoS 双维度提升，创造显著业务价值。
技术优势
全场景 AI 增强算法。针对游戏、UGC 内容、PGC 高清影视、在线教育、秀场、电商、老旧片源等不同场景定制行业领先的 AI 增强算法，全面提高音频和视频质量。
全面音频增强。支持语音降噪、音频分离、音质增强、音量均衡，显著提升音频清晰度和质量，满足各类场景下对高品质音频的需求。
﻿
计费详情
音视频增强功能基于转码实现，即增强处理是在转码处理基础上叠加增强参数。因此使用增强功能时，需要同时配置普通转码或极速高清转码参数和增强参数，收取转码和增强费用。
增强计费方式参见 音视频增强计费。
转码计费方式参见 普通转码计费或 极速高清转码计费。
视频增强能力
能力
﻿
描述
基础画质增强
大模型增强
基于 Diffusion 大模型，利用其强大的 AI 生成能力，显著提升视频画质修复效果，效果远超常规方法，尤其适合修复老旧视频。
﻿
综合增强
通过 AI 的综合分析能力，自动平衡画面中的纹理内容，在去除压缩伪影和毛刺的同时增强关键细节，从而提高整个画面的总体主观感受。
﻿
去毛刺增强
去毛刺技术通过分析编码信息，智能去除伪影，修复画面毛刺、模糊或颜色不自然问题，恢复画面清晰度和自然度，从而提升视频整体质量。
扩展增强能力
智能插帧
开启后，若设置的插帧帧率比源文件帧率高，将通过分析相邻帧之间的运动，智能生成中间帧，给用户提供更加流畅丝滑的视觉效果。
﻿
超分辨率
超分辨率可以识别视频的内容与轮廓，高清重建视频的细节与局部特征，将低分辨率的视频转换为高分辨率的视频，适用于老片修复等场景。
﻿
HDR
支持 HDR10、HLG，能够获得更宽的色域，展现更多色彩细节，以提供更高品质的视频内容。
﻿
低光照增强
因环境状况及拍摄摄像头的硬件限制，在某些场景下拍摄的画面存在亮度和对比度缺失问题，导致画面较暗或细节缺失。通过开启低光照增强，可以大幅提升暗区的细节和对比度，提升人眼主观质量。
﻿
色彩增强
旨在改善视频的色彩表现，使画面更接近真实色彩，并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度，修复因采集设备或保存问题导致的色彩失真，从而提升视频的整体视觉效果。
﻿
视频降噪
影片拍摄中会因为相机和环境引入随机噪点，视频降噪服务能够在保持细节不损失的情况下，消除画面中的随机噪声。
﻿
去划痕
去划痕可以修复视频中的划痕和雪花点等被破坏的内容。
音频增强能力
能力
描述
音频降噪
通过智能算法识别并消除背景噪声，同时保留并增强人声或主音信号，显著提升音频清晰度和听觉体验。
音频分离
分离音视频文件中人声与背景声，或者演唱声和伴奏声，便于实现其他后期加工。
音量均衡
智能识别并调整音量，避免出现过于响亮、过于安静或音量突变的问题，提供更好的听觉体验。
音频美化
智能美化音频，去除杂音、压制尖锐刺耳等不自然齿音，改善音频质量。
适用场景
音视频增强适用于 UGC/PGC 视频质量提升、游戏直播录制、老片翻新、低分辨率超分增强等业务场景。
场景
说明
UGC/PGC
视频质量提升
通过人脸增强技术，在消除人脸整体的模糊和压缩损伤的同时，进一步对人脸关键的五官重建，对眼睛、嘴巴、耳朵、皮肤甚至发丝都进行了细节重建和纹理添加，显著增加面部细节和质感。
游戏直播录制
直播流录制前通常会先进行转码，以解决由于断流等导致录制文件异常的问题，但是转码过程产生视频压缩会导致画面效果失真、模糊，该模板主要进行去压缩失真修复，较好地还原画面细节，提升视觉效果。
老片翻新
部分老片受限于当时拍摄的技术，可能出现大量的伪影、划痕等，画质较差。利用画质重生的修复和增强能力，将老片翻新，让老片「焕发新生」。
低分辨率超分
受限于拍摄条件、存储成本等因素，有的存档视频以较低分辨率存储，如今需要在较高显示设备播放，如果直接将低分辨率视频转码为高分辨率视频，视频画面会更模糊。通过云点播画质重生超分，结合低画质修复、关键细节增强等 AI 处理，确保超分后视频具有较高的画质。
使用方式
1. 控制台使用，具体请参见 音视频增强。
2. 详细开发指南请参见 音视频增强。
2.1 发起音视频增强任务，具体请参见 任务发起。
2.2 获取音视频增强的结果，具体请参见 查询任务详情 和 拉取事件通知。
﻿

能力			描述
基础画质增强	大模型增强	基于 Diffusion 大模型，利用其强大的 AI 生成能力，显著提升视频画质修复效果，效果远超常规方法，尤其适合修复老旧视频。
		综合增强	通过 AI 的综合分析能力，自动平衡画面中的纹理内容，在去除压缩伪影和毛刺的同时增强关键细节，从而提高整个画面的总体主观感受。
		去毛刺增强	去毛刺技术通过分析编码信息，智能去除伪影，修复画面毛刺、模糊或颜色不自然问题，恢复画面清晰度和自然度，从而提升视频整体质量。
扩展增强能力	智能插帧	开启后，若设置的插帧帧率比源文件帧率高，将通过分析相邻帧之间的运动，智能生成中间帧，给用户提供更加流畅丝滑的视觉效果。
		超分辨率	超分辨率可以识别视频的内容与轮廓，高清重建视频的细节与局部特征，将低分辨率的视频转换为高分辨率的视频，适用于老片修复等场景。
		HDR	支持 HDR10、HLG，能够获得更宽的色域，展现更多色彩细节，以提供更高品质的视频内容。
		低光照增强	因环境状况及拍摄摄像头的硬件限制，在某些场景下拍摄的画面存在亮度和对比度缺失问题，导致画面较暗或细节缺失。通过开启低光照增强，可以大幅提升暗区的细节和对比度，提升人眼主观质量。
		色彩增强	旨在改善视频的色彩表现，使画面更接近真实色彩，并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度，修复因采集设备或保存问题导致的色彩失真，从而提升视频的整体视觉效果。
		视频降噪	影片拍摄中会因为相机和环境引入随机噪点，视频降噪服务能够在保持细节不损失的情况下，消除画面中的随机噪声。
		去划痕	去划痕可以修复视频中的划痕和雪花点等被破坏的内容。

能力	描述
音频降噪	通过智能算法识别并消除背景噪声，同时保留并增强人声或主音信号，显著提升音频清晰度和听觉体验。
音频分离	分离音视频文件中人声与背景声，或者演唱声和伴奏声，便于实现其他后期加工。
音量均衡	智能识别并调整音量，避免出现过于响亮、过于安静或音量突变的问题，提供更好的听觉体验。
音频美化	智能美化音频，去除杂音、压制尖锐刺耳等不自然齿音，改善音频质量。

场景	说明
UGC/PGC 视频质量提升	通过人脸增强技术，在消除人脸整体的模糊和压缩损伤的同时，进一步对人脸关键的五官重建，对眼睛、嘴巴、耳朵、皮肤甚至发丝都进行了细节重建和纹理添加，显著增加面部细节和质感。
游戏直播录制	直播流录制前通常会先进行转码，以解决由于断流等导致录制文件异常的问题，但是转码过程产生视频压缩会导致画面效果失真、模糊，该模板主要进行去压缩失真修复，较好地还原画面细节，提升视觉效果。
老片翻新	部分老片受限于当时拍摄的技术，可能出现大量的伪影、划痕等，画质较差。利用画质重生的修复和增强能力，将老片翻新，让老片「焕发新生」。
低分辨率超分	受限于拍摄条件、存储成本等因素，有的存档视频以较低分辨率存储，如今需要在较高显示设备播放，如果直接将低分辨率视频转码为高分辨率视频，视频画面会更模糊。通过云点播画质重生超分，结合低画质修复、关键细节增强等 AI 处理，确保超分后视频具有较高的画质。

音视频增强

本页目录：

音视频增强功能简介

概述

技术优势

计费详情

视频增强能力

音频增强能力

适用场景

使用方式