一、音视频增强功能简介
1. 概述
音视频增强功能依托 MPS 业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。
技术优势
全场景 AI 增强算法。针对游戏、UGC 内容、PGC 高清影视、在线教育、秀场、电商、老旧片源等不同场景定制行业领先的AI增强算法,全面提高音频和视频质量。
全面音频增强。支持语音降噪、音频分离、音质增强、音量均衡,显著提升音频清晰度和质量,满足各类场景下对高品质音频的需求。

注意:
2. 如何使用音视频增强功能
(1)使用前须知
(2)创建音视频增强任务
腾讯云媒体处理提供以下三种任务发起方式:控制台快速创建任务、API 发起任务和自动触发任务,下方流程图展示了各任务发起方式的通用操作流程,若需了解音视频增强任务的具体配置方法,请参考下文 创建音视频增强任务的详细说明。

二、创建音视频增强任务
方式1. 控制台快速创建任务
1. 进入 媒体处理控制台,依次点击创建任务 > 快速创建点播处理任务。

2. 首先指定输入视频文件,您可选择从 COS 或 AWS S3 存储桶中选择音视频文件,或提供文件下载 URL 地址。
3. 然后,在步骤“处理输入文件”出,加入音视频增强节点。

4. 在弹出的音视频增强的设置抽屉中,选择所需的音视频增强模板。
注意:
控制台音视频增强模板暂未开放转码类型、码率、GOP 等详细转码参数配置(默认使用普通转码,码率、GOP 等参数使用默认值,一般为随源或自动)。因此,若您需要调整转码相关参数,推荐您使用 API 的方式新增增强模板,单击 查看指引。

5. 最后,指定输出视频保存路径后,即可单击创建发起任务。

方式2. API 发起任务
方式一:调用 ProcessMedia API,通过指定模板ID发起任务。示例:
注意:
控制台音视频增强模板暂未开放转码类型、码率、GOP 等详细转码参数配置(默认使用普通转码,码率、GOP 等参数使用默认值,一般为随源或自动)。因此,若您需要调整转码相关参数,推荐您使用 API 的方式新增增强模板,单击 查看指引。
{"InputInfo": {"Type": "URL ","UrlInputInfo": {"Url": "https://test-1234567.cos.ap-guangzhou.myqcloud.com/video/test.mp4"// 替换成需要处理的视频 URL}},"OutputStorage": {"Type": "cos","CosOutputStorage": {"Bucket": "test-1234567","Region": "ap-guangzhou"}},"MediaProcessTask": {"TranscodeTaskSet": [{"Definition": 100910 //100910为预设视频增强-综合增强、色彩增强、去毛刺模板ID,可替换为您的自定义音视频增强模板ID}]}}
方式二:调用 ProcessMedia API,通过指定服务编排ID发起任务。示例:
{"InputInfo": {"Type": "URL ","UrlInputInfo": {"Url": "https://test-1234567.cos.ap-guangzhou.myqcloud.com/video/test.mp4"// 替换成需要处理的视频 URL}},"OutputStorage": {"Type": "cos","CosOutputStorage": {"Bucket": "test-1234567","Region": "ap-guangzhou"}},"OutputDir": "/output/","ScheduleId": 12345 //替换为自定义编排ID,12345为填写示例,不具备实际意义}
API Explorer 快速验证

方式3. COS 上传文件后自动触发 MPS 任务
若您希望实现:在 COS 桶中上传了视频文件,并自动按照预设参数进行音视频增强处理。您可以:
1. 在创建任务时单击保存此编排,在弹出的窗口中配置触发 Bucket、触发目录等参数。

2. 然后进入点播编排列表,找到刚创建好的编排,在启动处开启按钮即可。后续在触发目录下新增的视频文件,将自动按照该编排预设的流程和参数发起任务,并将处理后的视频文件保存到编排配置的输出路径中。
注意:
启用编排成功后,需要3-5分钟才会生效。

三、查询任务结果
1. 任务回调
在使用 ProcessMedia 发起媒体处理任务时,可以通过
TaskNotifyConfig
参数设置回调信息。当任务处理完成后,会通过配置的回调信息回调任务结果,您可以通过 ParseNotification 解析事件通知结果。2. 查询任务结果
(1)调用 DescribeTaskDetail 接口查询任务结果

(2)控制台查询任务结果
1. 进入控制台 点播任务管理,任务列表中会展示刚发起的任务。

2. 当子任务状态为“成功”时,您可以进入 COS Bucket > 输出 Bucket 中,找到您的输出位置,即可对音视频增强输出文件进行预览、下载等操作。

四、音视频增强相关扩展参数
部分最新模型暂未开放配置,如需使用,请联系我们进行后台配置。包括如下功能:
功能 | 说明 |
综合增强(优化版) | 综合增强技术通过 AI 算法对视频中的内容进行分析和优化,尤其关注提升人脸的清晰度、细节和色彩表现。从头到尾提供更高的显示质量和精致的细节,使面部特征更清晰,细节更丰富。 |
色彩增强(优化版) | 色彩增强功能旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。色彩增强功能可以显著提升视频的色彩质量,让画面更加生动和吸引人。 |
去毛刺(优化版) | 去毛刺功能主要用于修复视频在转码或多次转码过程中引入的失真,如块效应、振铃效应等。这些失真通常表现为画面中的毛刺、模糊或颜色不自然的现象,严重影响视觉效果。去毛刺技术通过分析视频的编码信息,智能去除这些伪影,从而恢复画面的清晰度和自然度。音视频增强服务中的去毛刺功能可以有效修复编码引入的失真,提升视频的整体质量。 |
生成式大模型画质修复 | 大模型是基于深度学习 CNN 的增强模型,它可以覆盖大多数的业务场景视频, 尤其对于一些损失严重的老视频修复效果极佳。使用扩散大模型进行修复,可以让训练数据更贴近于真实老片场景,避免因模型过小、难以训练导致的细节修复不佳。 同时,将增强模型建立在已有的强大的文生图和文生视频的基础模型之上,充分利用他们的各种语义和细节的先验信息进行视频画质修复,能够到达远超常规方法的效果。 |
五、常见问题
如何创建音视频增强模板?
系统提供了几种预设增强模板供您选用,您也可以根据业务需要,创建自定义音视频增强模板,针对不同应用场景预设不同的处理参数,便于后续复用。您可以通过控制台和 API 创建音视频增强模版,若包含转码相关参数配置的需求,推荐您使用 API 的方式新增增强模板,单击 查看指引。