来源:SPIE 2021 主讲人:Evgeniy Upenik 内容整理:付一兵 本文来自SPIE 2021,评估了压缩工作流场景中可用的最先进的超分方法,并提出了一个超分网络的改进版本,对其进行重新训练以处理压缩域中的图像,最后与基线进行基准测试来评估其性能。
目录
近年来,基于学习的图像编码已经显示出很好的效果。在我们的工作中,我们将只考虑单一图像的超分。与视频超分不同,视频可以利用后续帧之间的关联性来获得额外的性能和质量。
对于单图像超分,现今基于学习的方法明显优于所有经典的方法。

传统重采样方法,包括 Bilinear、Bicubic 和 lanczos 重采样等
下图来源于Papers With Code网站,是关于图像超分的最新成果。过去几年,基于学习的图像超分在视觉质量方面获得了相当多的性能。

图像超分的最新成果
那么,我们工作背后的动机是什么呢?
因此,我们可以尝试将它们结合起来,这看起来很自然。
那么,这可能会有什么应用呢?
值得一提的是,有一些标准化活动,其目的是使基于学习的编码解决方案标准化。而他们自然包括压缩领域的图像处理任务,以及用例和要求。
下图可以看到基于学习的压缩的研究和发展时间表。尽管它始于 2006 年的 Hinton 等人,但直到 2016、2017 年,我们才看到良好的性能。而最近的论文从 2019、2020 年开始,与前几年相比,仍然获得了更好的性能。所以可以认为我们还没饱和到能够超越经典方法。

基于学习的压缩研究和发展的时间表
在我们的工作中,我们决定选择 "Variational image compression with a scale hyperprior" 作为编码器框架。这个框架非常有名,易于使用。在我们的案例中,我们使用的是 Compress AI 的实现。
关于超分方法,我们比较了其中的四种,分别是 EDSR、WDSR、SRGAN 和 ESRGAN,下图中为相应的参考资料。我们不打算详细介绍它们的架构,因为这并不是我们论文的目标。

四种超分方法的参考文献
如今,几乎所有由现代相机拍摄的、通过通信网络传播的或存储的图像都是用有损编解码器压缩的,其代价是降低视觉质量。此外,为了在这些图像上执行图像处理任务,例如超分,通常需要额外的解压缩步骤。
因此,尽管我们的目标是研究压缩域的超分,在本节中,我们建立并准备了一个基准,用于评估有损压缩是像素级图像处理流程的一部分的情况下的超分的性能。
我们尝试在基于端到端学习的编解码器解码之后应用超分,然后将得到的图像与下采样后送入压缩算法的原始高分辨率图像进行比较。流程图如下图所示。

流程图
下图是不同的超分方法的评估图。我们从 DIV2K 数据集中压缩了五幅图像,选择了八个不同的比特率用于编解码器。之后,我们将不同的超分方法应用于这些解码的图像。

不同超分方法的评估图
结果有两张图,一张是 PSNR 对比特率的图,另一张是 MS-SSIM 对比特率的图。
结果显示,WDSR 是表现最好的超分网络之一。但无论在哪种情况下,误差条都是重叠的。因此,我们不能真正得出结论,哪个一定更好。
与人类设计的算法不同,例如 JPEG,它使用线性变换,基于学习的编解码器使用自动编码器架构,可以被解释为非线性变换。在数据的维度降低后应用熵编码,以得到一个数据流。同样,在解码端,我们应用熵解码器和反变换,也就是自动编码器的解码器部分。

上图中,
下图是JPEG AI 提出的架构,作为一个例子。这是标准化的活动,所以在这个图中,除了标准的图像重建,它被建议使用一个解码器,它可以在解码后的潜空间中执行图像处理任务或计算机视觉任务,而超分是图像处理任务的一种。

最后,是我们在评估中使用的架构。下图显示了基于学习的编解码器 bmshj2018-hyperprior12 和超分网络 ESRGAN6 的耦合。在熵编码之前,超分网络的输入直接连接到压缩网络的输出。

耦合系统的训练与 ESRGAN 的训练过程相同,不同的是,在将训练图像送入ESRGAN之前,它们通过预先训练的 bmshj2018-hyperprior 模型进行前向传播,以获得相应的质量,而没有熵编码步骤。
为了比较我们的解决方案,我们使用了两个基线,

就 PSNR 而言,我们的解决方案实际上优于基线。在四幅图像中,有三幅图像的 PSNR 相对高于其他图像。只有其中一张非常接近。但并不是每一种情况都能胜过应用于未压缩图像的超分。所以仍有改进的余地。
下图是计算了 MS-SSIM 的结果。MS-SSIM 的结果与之前的不一致,它可能受到了损失函数的影响,因为损失函数与 PSNR 关联更大。

下图一些定性的结果。CDSR 代表压缩域超级分辨率。它是在所选编解码器的质量为 Q6 的情况下,以 4 的比例使用的。可以看到它在视觉上比任何经典的解决方案要好得多。

最后附上演讲视频:
http://mpvideo.qpic.cn/0bc3cuaaaaaaryalkwu4sjqvafodaakqaaaa.f10002.mp4?dis_k=bbcfbdb863e14b2dddbad0f9a991c457&dis_t=1638411356&vid=wxv_2148620956632743939&format_id=10002&support_redirect=0&mmversion=false