文档中心>媒体处理>接入教程>音视频增强接入

音视频增强接入

最近更新时间:2025-05-23 16:46:42

我的收藏

一、音视频增强功能简介

1. 概述

音视频增强功能依托 MPS 业界领先的音视频 AI 处理模型和丰富的业务数据积累,提供专业级音视频增强解决方案。该功能支持分布式实时画质增强,包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR、大模型增强等功能,可大幅提升音视频质量,广泛应用于 OTT、电商、赛事等场景,有效实现 QoE 与 QoS 双维度提升,创造显著业务价值。

技术优势

全场景 AI 增强算法。针对游戏、UGC 内容、PGC 高清影视、在线教育、秀场、电商、老旧片源等不同场景定制行业领先的AI增强算法,全面提高音频和视频质量。
全面音频增强。支持语音降噪、音频分离、音质增强、音量均衡,显著提升音频清晰度和质量,满足各类场景下对高品质音频的需求。

注意:
打开 体验馆,您可以快速体验音视频增强功能效果。

2. 如何使用音视频增强功能

(1)使用前须知

在使用音视频增强功能前,您需完成以下前置操作:腾讯云账号注册/登录开通并授权 COS 存储服务。具体操作指引请参考 快速入门。账号授权问题可参考 账号授权 文档。

(2)创建音视频增强任务

腾讯云媒体处理提供以下三种任务发起方式:控制台快速创建任务、API 发起任务和自动触发任务,下方流程图展示了各任务发起方式的通用操作流程,若需了解音视频增强任务的具体配置方法,请参考下文 创建音视频增强任务的详细说明。


二、创建音视频增强任务

方式1. 控制台快速创建任务

1. 进入 媒体处理控制台,依次点击创建任务 > 快速创建点播处理任务

2. 首先指定输入视频文件,您可选择从 COS 或 AWS S3 存储桶中选择音视频文件,或提供文件下载 URL 地址。
3. 然后,在步骤“处理输入文件”出,加入音视频增强节点。

4. 在弹出的音视频增强的设置抽屉中,选择所需的音视频增强模板。
注意:
控制台音视频增强模板暂未开放转码类型、码率、GOP 等详细转码参数配置(默认使用普通转码,码率、GOP 等参数使用默认值,一般为随源或自动)。因此,若您需要调整转码相关参数,推荐您使用 API 的方式新增增强模板,单击 查看指引

5. 最后,指定输出视频保存路径后,即可单击创建发起任务。


方式2. API 发起任务

方式一:调用 ProcessMedia API,通过指定模板ID发起任务。示例:
注意:
控制台音视频增强模板暂未开放转码类型、码率、GOP 等详细转码参数配置(默认使用普通转码,码率、GOP 等参数使用默认值,一般为随源或自动)。因此,若您需要调整转码相关参数,推荐您使用 API 的方式新增增强模板,单击 查看指引
{
"InputInfo": {
"Type": "URL ",
"UrlInputInfo": {
"Url": "https://test-1234567.cos.ap-guangzhou.myqcloud.com/video/test.mp4"// 替换成需要处理的视频 URL
}
},
"OutputStorage": {
"Type": "cos",
"CosOutputStorage": {
"Bucket": "test-1234567",
"Region": "ap-guangzhou"
}
},
"MediaProcessTask": {
"TranscodeTaskSet": [
{
"Definition": 100910 //100910为预设视频增强-综合增强、色彩增强、去毛刺模板ID,可替换为您的自定义音视频增强模板ID
}
]
}
}
方式二:调用 ProcessMedia API,通过指定服务编排ID发起任务。示例:
{
"InputInfo": {
"Type": "URL ",
"UrlInputInfo": {
"Url": "https://test-1234567.cos.ap-guangzhou.myqcloud.com/video/test.mp4"// 替换成需要处理的视频 URL
}
},
"OutputStorage": {
"Type": "cos",
"CosOutputStorage": {
"Bucket": "test-1234567",
"Region": "ap-guangzhou"
}
},
"OutputDir": "/output/",
"ScheduleId": 12345 //替换为自定义编排ID,12345为填写示例,不具备实际意义
}
API Explorer 快速验证
1.首先,请前往 媒体处理控制台开通服务,确认已完成 COS 授权
2.然后,进入媒体处理 API Explorer在线调试页面,在左侧接口列表选择 发起媒体处理 接口。参考下图填写输入路径、输出路径、模板ID、编排ID等参数, 即可发起 API 在线调用。


方式3. COS 上传文件后自动触发 MPS 任务

若您希望实现:在 COS 桶中上传了视频文件,并自动按照预设参数进行音视频增强处理。您可以:
1. 在创建任务时单击保存此编排,在弹出的窗口中配置触发 Bucket、触发目录等参数。

2. 然后进入点播编排列表,找到刚创建好的编排,在启动处开启按钮即可。后续在触发目录下新增的视频文件,将自动按照该编排预设的流程和参数发起任务,并将处理后的视频文件保存到编排配置的输出路径中。
注意:
启用编排成功后,需要3-5分钟才会生效。


三、查询任务结果

1. 任务回调

在使用 ProcessMedia 发起媒体处理任务时,可以通过TaskNotifyConfig 参数设置回调信息。当任务处理完成后,会通过配置的回调信息回调任务结果,您可以通过 ParseNotification 解析事件通知结果。

2. 查询任务结果

(1)调用 DescribeTaskDetail 接口查询任务结果

调用 DescribeTaskDetail接口,输入任务 ID(例如:24000022-ScheduleTask-774f101xxxxxxx1tt110253),查询任务结果。


(2)控制台查询任务结果

1. 进入控制台 点播任务管理,任务列表中会展示刚发起的任务。

2. 当子任务状态为“成功”时,您可以进入 COS Bucket > 输出 Bucket 中,找到您的输出位置,即可对音视频增强输出文件进行预览、下载等操作。


四、音视频增强相关扩展参数

部分最新模型暂未开放配置,如需使用,请联系我们进行后台配置。包括如下功能:
功能
说明
综合增强(优化版)
综合增强技术通过 AI 算法对视频中的内容进行分析和优化,尤其关注提升人脸的清晰度、细节和色彩表现。从头到尾提供更高的显示质量和精致的细节,使面部特征更清晰,细节更丰富。
色彩增强(优化版)
色彩增强功能旨在改善视频的色彩表现,使画面更接近真实色彩,并在一定程度上进行增强以满足人眼的喜好。它通过调整色彩的饱和度、对比度和亮度,修复因采集设备或保存问题导致的色彩失真,从而提升视频的整体视觉效果。色彩增强功能可以显著提升视频的色彩质量,让画面更加生动和吸引人。
去毛刺(优化版)
去毛刺功能主要用于修复视频在转码或多次转码过程中引入的失真,如块效应、振铃效应等。这些失真通常表现为画面中的毛刺、模糊或颜色不自然的现象,严重影响视觉效果。去毛刺技术通过分析视频的编码信息,智能去除这些伪影,从而恢复画面的清晰度和自然度。音视频增强服务中的去毛刺功能可以有效修复编码引入的失真,提升视频的整体质量。
生成式大模型画质修复
大模型是基于深度学习 CNN 的增强模型,它可以覆盖大多数的业务场景视频, 尤其对于一些损失严重的老视频修复效果极佳。使用扩散大模型进行修复,可以让训练数据更贴近于真实老片场景,避免因模型过小、难以训练导致的细节修复不佳。 同时,将增强模型建立在已有的强大的文生图和文生视频的基础模型之上,充分利用他们的各种语义和细节的先验信息进行视频画质修复,能够到达远超常规方法的效果。

五、常见问题

如何创建音视频增强模板?

系统提供了几种预设增强模板供您选用,您也可以根据业务需要,创建自定义音视频增强模板,针对不同应用场景预设不同的处理参数,便于后续复用。您可以通过控制台和 API 创建音视频增强模版,若包含转码相关参数配置的需求,推荐您使用 API 的方式新增增强模板,单击 查看指引

增强功能是否支持配置编码相关参数,例如码率、GOP 等?

增强功能支持配置编码相关的参数。目前控制台创建增强模板时,仅支持修改编码标准、分辨率和帧率,若需设置更多与转码相关的参数,如码率、GOP 等,请使用 API 方式创建增强模板,单击 查看指引

如何获取最佳的增强效果?

音视频增强包含视频去毛刺、降噪、色彩增强、细节增强、人脸增强、SDR2HDR 等功能,如果您对自行组合测试的效果仍不满意,可以直接 联系我们 获取详细的配置建议并进行高级参数调优。

增强的计费标准是什么?

音视频增强基于转码实现,因此发起一次音视频增强任务,将收取 音视频增强+音视频转码(普通转码或极速高清转码) 两笔费用,详细可参考 音视频增强计费 文档说明。