新的一年来了,想给自己找个难度大的挑战?有哪些问题是有重大意义,同时ML介入后会有很大的改善空间?
不如考虑一下谷歌赞助的2018年CVPR机器学习图像压缩比赛。
要知道,如果没有图像压缩技术,处理一张12M的图,需要占用36兆的内存;不是文本的网站根本别想打开;整个互联网世界会因为缺少丰富的数字影像,灰暗到无法想象。
尽管在信号处理界里,现代图像编解码器BPG、WebP压缩图像的效果,比1980年代引入的JPEG的压缩效果要好得多。但是,现在很多压缩技术用的依然是JPEG那套像素转换方式。
谷歌近期的几个端对端机器学习研究项目,用超分辨率成像提升了JPEG图像的压缩效果。不过,谷歌还是希望能引起更多做机器学习研究的人的兴趣,投入到这个领域里,给压缩技术带来更多的改进。
因此,谷歌联合苏黎世联邦理工学院、推特,一起赞助了这次CLIC,机器学习图像压缩的比赛。这场比赛将会在2018的CVPR期间举行。
这次论坛也会邀请对图像压缩技术有巨大贡献的几位专家,以及最早把机器学习引入这个领域的人做主题演讲。
其中包括:谷歌的图像视频压缩专家Jim Bankoski和德国亚琛工业大学的Jens Ohm,WaveOne的CV+ML专家Oren Ripple,即将要离开康奈尔加盟谷歌的Ramin Zabih。
△ 谷歌图像视频压缩专家Jens Ohm
苏黎世联邦理工学院ETC Zürich为了加速这个领域的研究进展,给这次比赛提供了没有版权的高清图像数据库,数据集P(professional)和数据集M(mobile)。其中含有1633张没有压缩处理的图片。
这次比赛,大家用什么训练集组织方不做限制。他们反而鼓励参赛者充分利用ImageNet或Open Images Dataset上的数据。
2016年发表的第一代压缩大型图像的神经网络,勉强达到JPEG的效果。最近有不少文章发表,说自己得到的神经网络,比起现有业界内标准的图像压缩技术要好。
而如果说只是一小撮的ML实验室的研究资源放在这领域上都能取得这么瞩目的进步,那么谷歌更加期待当更多ML人加入到圈子里,会出现更好的压缩效果技术。
1月15号会上线压缩效果评价系统,2月15号公布测试集,最后提交截止日期在2月22号。
关于比赛的具体细节,可以前往compression.cc了解。
最后,附训练集下载地址:
专业组数据集P https://data.vision.ee.ethz.ch/cvl/clic/professional_train.zip
移动端数据集M https://data.vision.ee.ethz.ch/cvl/clic/mobile_train.zip
编译来源 https://research.googleblog.com/2018/01/introducing-cvpr-2018-learned-image.html