CVPR 2018 图像压缩挑战赛结果出炉,腾讯音视频实验室压缩性能第一

雷锋网 AI 研习社按,CVPR 2018 图像压缩挑战赛(CLIC)结果已经出炉,腾讯音视频实验室和武汉大学陈震中教授联合团队于该项挑战赛上取得压缩性能第一。(腾讯音视频实验室凭借在 CLIC 中 PSNR 指标第一在雷锋网学术频道 AI 科技评论旗下数据库项目「AI 影响因子」中增加 10 分。)

CVPR 是计算机视觉领域的盛宴,全世界相关领域的顶尖学者、研究人员和企业都会积极参与。今年,CVPR 新增了图像压缩 workshop 和挑战赛议程,这场挑战赛由 Google、Twitter、Amazon 等公司联合赞助,是第一个由计算机视觉领域的会议发起的图像压缩挑战赛,旨在将神经网络、深度学习等一些新的方式引入到图像压缩领域。

图像压缩技术对于互联网信息传输有至关重要的意义。一张未经压缩的 1200 万像素的图片就会占用 36MB 的存储空间,而目前网络上每天图片传输、存储数量数以亿万计,为了节省带宽资源、存储资源,减少服务器的压力,高效的图像压缩算法必不可少。

据大会官方介绍,此次挑战赛分别从 PSNR 和主观评价两个方面去评估参赛团队的表现。峰值信噪比(PSNR)衡量的是压缩前后两张图逐像素统计所产生的误差,峰值信噪比越高,代表两张图误差越小,也就意味着压缩后的图与原图越接近、图片质量损失越小。

腾讯音视频实验室和武汉大学陈震中教授联合团队 iipTiramisu 在 PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)指标上占据领先优势,在决赛数据集上比第二名高了 0.13 dB,位列第一。

据陈震中教授介绍,iipTiramisu 团队使用了基于传统混合框架(hybrid image coder)融入深度学习的编码模块 CNNMC 以及 CNN in-loop filter,以及基于不确定性的资源分配策略,最终可以在数据集压缩性能上比 BPG 提升 30% 以上。

从下图可以看到,与业界最优秀的开源图像压缩算法之一 BPG 相比,iipTiramisu 在峰值信噪比上有显著的优势:

Fig.1 The Rate-PSNR curve of different encoders. (bit-rate range 0.05-0.35 bpp)

信噪比不变的情况下,在性能优先模式下 iipTiramisu 比 BPG 节省 30.8% 的码率,速度优先模式下比 BPG 节省 27.9% 的码率。

Fig.2 Compressed by BPG, bit rate:0.14 bpp, PNSR:31.45 dB.

Fig.3 Compressed by iipTiramisu, bit rate:0.14 bpp, PNSR:33.03 dB

在码率都为 0.14 bpp 的情况下,iipTiramisu 的峰值信噪比比 BPG 高 1.58 dB,质量损失率明显减少。

关于该比赛的更多信息,可参见如下地址:

http://www.compression.cc/challenge/

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-06-14

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏专知

机器学习是“炼金术”?

17760
来自专栏大数据文摘

机器也有品味:谷歌最新算法让街景图具有专业摄影师审美

16820
来自专栏AI研习社

告别五毛特效,AI 轻松再现多层材料质感

在影视作品和网络游戏中,往往需要通过计算机技术制作出大量的虚拟图像,例如建筑、车辆、甚至是河水山峦,从而降低制作成本、保证演员的安全、增强观众或游戏用户的视觉真...

13030
来自专栏新智元

MIT非视线成像“透视相机”:隔墙观物、影中窥人!

2012年,MIT计算机视觉科学家安东尼奥·托拉尔巴(Antonio Torralba)在西班牙海岸度假时,发现他酒店房间墙壁上的杂散阴影似乎不是由任何东西投射...

17050
来自专栏人工智能快报

深度学习帮助科学家开展实时引力波探测

“ 美国国家超级计算应用中心的科学家正在利用深度学习对引力波进行实时探测。 ” 位于美国伊利诺伊大学厄巴纳-尚佩恩分校(University of Illi...

39280
来自专栏大数据文摘

VR如何巧妙填补传统数据视觉化的漏洞

18540
来自专栏机器之心

资源 | CNN入门材料:《解析卷积神经网络——深度学习实践手册》

496100
来自专栏玉树芝兰

文科生如何理解卷积神经网络?

不愿意看那一堆公式符号,却想知道卷积神经网络(Convolutional Neural Network)如何做图像分辨?分享一段我给自己研究生的讲解答疑视频,希...

13730
来自专栏CDA数据分析师

《谁动了我的奶酪》中的粒子群算法

本文为作者郭飞原创,CDA数据分析师已获得授权 1、《谁动了我的奶酪》是讲啥的? 其实这本书是一碗上古的老鸡汤。 故事大概是这样的,有4个小生命,其中有两只老鼠...

23260
来自专栏媒矿工厂

AI如何用于现场直播场景

与许多产业一样,通过软件和算法辅助,电视与视频制作很可能被人工智能和机器学习所改造,而当前这些制作任务都是由人来执行。随着现场直播报道涉及的范围越来越广,而相关...

41530

扫码关注云+社区

领取腾讯云代金券