前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >基于深度神经网络的帧重建以优化视频编码

基于深度神经网络的帧重建以优化视频编码

作者头像
用户1324186
发布2020-01-14 17:15:58
7200
发布2020-01-14 17:15:58
举报
文章被收录于专栏:媒矿工厂媒矿工厂

本文是来自AOMedia Symposium 2019的演讲,讲者是来自于杭州师范大学的Dandan Ding。本次演讲以AV1为例,主要讲述了使用神经网络做环内滤波的两个问题,即如何设计网络结构和如何嵌入网络。

Ding首先介绍了这个项目的背景、目标和主要问题。针对网络结构的问题,帧内滤波可以视为超分辨率问题,典型的网络有VDSR(极深超分网络)、ResNet,在1M参数量时有0.8dB的PSNR增益。作者通过优化模型,在20k参数量时达到0.25dB增益。

之后讲者针对嵌入网络的方式展开了讨论。直接替换原模块,所有帧都参与CNN滤波,增益反而降低,产生了过度滤波的问题。一种解决方案是跳过某些帧,可以通过比较率失真来判决某个CTU使用传统滤波器还是CNN滤波器。讲者针对帧结构提出了一种跳过策略。另一种解决方案是全局滤波模型,针对不同程度的失真图像都训练。讲者提出了渐进训练的方法,将CNN滤波后的重建帧再次放入训练集。

此外,讲者还提出了多帧参考的方法,用一对高质量帧来增强中间的低质量帧。最后讲者做了总结。

最后附上演讲视频:

http://mpvideo.qpic.cn/0bf2hqaaaaaagqaa42qgevpfapgdaa6aaaaa.f10002.mp4?dis_k=439e9a4b3e90aab8473c800191500fce&dis_t=1578993339

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-12-28,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 媒矿工厂 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档