前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >2017-ICLR-END-TO-END OPTIMIZED IMAGE COMPRESSION

2017-ICLR-END-TO-END OPTIMIZED IMAGE COMPRESSION

作者头像
hotarugali
发布2022-05-01 14:00:54
1.1K0
发布2022-05-01 14:00:54
举报

1. 摘要

本文提出了一种图像压缩框架,其由一个非线性分析变换、一个均匀量化器和一个非线性综合变换组成。这些变换都三层结构,每一层由一个卷积线性过滤器和非线性的激活函数构成。与大多数卷积神经网络不同的是,这些联合的非线性是用来实现一种局部增益控制,这种局部增益控制最初是来源于生物神经元领域的发现(局部增益控制已经成为生物神经元建模的一种方法)。作者使用随机梯度下降方法来联合优化整个模型的率失真性能。针对均匀标量量化器的目标函数不连续问题,作者提出了一种连续可微的近似量化,从而保证在优化过程中梯度能有效地反传。最后在测试集上,作者提出压缩模型展现出比 JPEG 和 JPEG2000 更好的性能。而且,该压缩模型在所有码率和所有图像上,MS-SSIM 性能都要好于 JPEG 和 JPEG2000。

2. 引言

数据压缩一直以来都是一个工程基础问题,自香农提出熵信息以来,数据压缩问题得到很好的研究。对于给定的离散数据,最优的压缩编码可以通过最小化编码熵来得到。而这个最优的压缩编码严重依赖于数据本身的概率分布,因此设计一个最优的压缩编码本质也是对数据分布进行建模的问题。然而,实际的编码必须具有有限的熵,因此连续值数据必须量化成一系列有限的离散值,而这会导致误差的引入。在这篇文章中,作者研究的便是有损压缩问题,针对有损压缩,我们必须平衡两个互斥的损失:离散编码的熵(率)和由量化引起的误差(失真)。因此最终要优化的目标函数即率失真函数。对于不同的压缩场景,比如数据存储或有限容量信道的数据传输,对不同的率失真 trade-off 要求也不同。

然而,联合优化率失真是很困难的。如果没有进一步的约束的话,这个问题的最优量化在高维空间是难以求解的。因此,大多数现有的图像压缩方法都是先通过一个线性变换将图像数据变换到合适的连续值表示,然后独立地量化这些连续值,最后使用一个无损的熵编码来编码量化得到的离散值。这个框架一般称为变换编码,因为变换在这个框架中起到决定性作用。比如,JPEG 使用 DCT 变换来编码像素块,而 JPEG2000 使用多尽度的正交小波变换来解耦图像块。通常,变换编码的三个组成部分:变换、量化、熵编码,往往是独立地进行优化的(而且往往是通过手动设置参数进行调整的)。

作者在本文中完善了他原先在另一篇文章中提出的一个基于非线性变换的端到端压缩框架,完善的框架如下图所示:

在他先前那篇文章中,他并没有详细介绍上述框架中的分析综合变换结构。在本文中,作者对此进行了进一步介绍,给出了该框架下的一个实际模型,并给出了充足的理论分析和实验来验证该模型的有效性。在此模型中,分析变换作者采用了级联线性卷积层和非线性层的结构,非线性层采用的是 GDN 模型(来源于作者的另一文章[3]);而综合变换则是采用了分析变换的近似逆结构。量化使用的是均匀的标量量化。

对于期望逼近的率失真曲线上的每个点,都直接使用梯度下降优化方法同时联合优化分析综合变换。对于均匀标量量化导致梯度几乎处处为 000 的问题,作者给出了一种连续的近似均匀标量量化来替代原来的离散均匀量化。最后,作者对量化后的数据使用了一个熵编码得到实际的比特流,从而计算该模型实际的码率,以此来验证该模型的有效性。

3. 分析、综合以及感知变换的选择

大多数压缩方法都是建立在正交线性变换基础上,目的是为了降低数据间的相关性,从而简化后续的熵编码。但是线性变换输出之间的联合统计特性展现了很强的高阶依赖。这个问题可以通过使用局部增益控制操作(最早来源于生物神经元领域)来很好地解决,于是作者使用了他自己在另一篇文章中提出的 GDN 模型来替代线性变换(在那篇文章中作者已经验证了 GDN 具有很好的高斯化图像数据的能力)。

更为具体的,作者在本文中提出的模型的分析综合变换结构均由三阶结构组成,具体如下图所示:

4. 优化非线性变换编码模型

4.1 模型优化

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2022-04-11,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 1. 摘要
  • 2. 引言
  • 3. 分析、综合以及感知变换的选择
  • 4. 优化非线性变换编码模型
    • 4.1 模型优化
    相关产品与服务
    文件存储
    文件存储(Cloud File Storage,CFS)为您提供安全可靠、可扩展的共享文件存储服务。文件存储可与腾讯云服务器、容器服务、批量计算等服务搭配使用,为多个计算节点提供容量和性能可弹性扩展的高性能共享存储。腾讯云文件存储的管理界面简单、易使用,可实现对现有应用的无缝集成;按实际用量付费,为您节约成本,简化 IT 运维工作。
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档