基于深度神经网络的帧重建以优化视频编码

用户1324186

发布于 2020-01-14 17:15:58

7200

发布于 2020-01-14 17:15:58

本文是来自AOMedia Symposium 2019的演讲，讲者是来自于杭州师范大学的Dandan Ding。本次演讲以AV1为例，主要讲述了使用神经网络做环内滤波的两个问题，即如何设计网络结构和如何嵌入网络。

Ding首先介绍了这个项目的背景、目标和主要问题。针对网络结构的问题，帧内滤波可以视为超分辨率问题，典型的网络有VDSR（极深超分网络）、ResNet，在1M参数量时有0.8dB的PSNR增益。作者通过优化模型，在20k参数量时达到0.25dB增益。

之后讲者针对嵌入网络的方式展开了讨论。直接替换原模块，所有帧都参与CNN滤波，增益反而降低，产生了过度滤波的问题。一种解决方案是跳过某些帧，可以通过比较率失真来判决某个CTU使用传统滤波器还是CNN滤波器。讲者针对帧结构提出了一种跳过策略。另一种解决方案是全局滤波模型，针对不同程度的失真图像都训练。讲者提出了渐进训练的方法，将CNN滤波后的重建帧再次放入训练集。

此外，讲者还提出了多帧参考的方法，用一对高质量帧来增强中间的低质量帧。最后讲者做了总结。

最后附上演讲视频：

http://mpvideo.qpic.cn/0bf2hqaaaaaagqaa42qgevpfapgdaa6aaaaa.f10002.mp4?dis_k=439e9a4b3e90aab8473c800191500fce&dis_t=1578993339

本文参与腾讯云自媒体分享计划，分享自微信公众号。

原始发表：2019-12-28，如有侵权请联系 cloudcommunity@tencent.com 删除

机器学习