开发 | 谷歌开源JPEG编码器Guetzli,压缩35%也能生成高质量图片

谷歌通过线上社区的形式创造了各种新的工具和工业标准,它们所衍生出的服务和产品旨在为使用者提供更好的线上体验。

谷歌近日开源了用于数字图像和网络图形的JPEG编码器 Guetzli( [guɛtsli], 在瑞士德语中被翻译为饼干)。与现有的方法相比,它能将高质量图片的大小缩小35%。这就使网站管理员可以使用更少的数据更快地加载网页,此外,它能兼容现有的浏览器、图像处理应用和JPEG标准。

从实现的角度来说Guetzli 与Zopfli算法类似,并不需要引入新的格式就能生成更小的PNG和gzip文件。与前段时间谷歌推出的基于循环神经网络(RNN)的图像压缩方法RAISR和WebP不同,它并不需要对客户端和系统环境进行修改。

JPEG图像的质量与多级压缩过程直接相关:色彩空间转换,离散余弦变换以及量化过程。

在这一阶段,为了得到更小的图片,图像质量也会随之降低。Guetzli通过引入搜索算法来减小JPEG和Guetzli在视觉模型上的差别,试图在最小的质量损失和文件大小之间找到平衡。Guetzli视觉模型用一种更全面和细致的方式来完成色彩感知和视觉遮蔽,以此来代替简单的色彩转换和离散余弦变换。但Guetzli生成更小文件的代价在于,这种搜索算法所需要的时间远远长于现有的压缩方法。

图1 16x16像素的合成示例:一根以蓝天为背景的电话线,传统的JPEG压缩算法会产生加工的痕迹。左图为未压缩的原图。相比于中图(libjpeg),右图(Guetzli)文件的大小更小,也更少出现振铃现象。

Guetzli在不牺牲质量的条件下生成了更小的图像文件。谷歌研究院在试验过程中发现,如果把压缩文件大小设为一个定值,相比于libjpeg图像,人类受试者仍然更倾向于Guetzli生成的图像,即使libjpeg文件大小与Guetzli相似或略大一点。

图2 20x24像素的猫眼图片。左图为未压缩的原图。相比于左图(libjpeg),右图(Guetzli)呈现更弱的振铃效应,并且文件大小也更小。

Guetzli 的目标用户是网站管理员和图形设计者。在多图网站中,Guetzli能够给用户提供更顺畅的体验,并且减少移动用户的加载时间和带宽消耗。此外,谷歌还希望这种新的尝试可以激励大家在图像和视频压缩领域的研究。

GitHub页面:https://github.com/google/guetzli/

via googleblog

原文发布于微信公众号 - AI科技评论(aitechtalk)

原文发表时间:2017-03-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏IT派

十大你不可忽视的机器学习项目

前言:那些流行的机器学习项目之所以受欢迎,一般是因为其提供了一种多数人需要的服务,或是因为它们是第一个(也许是最好的)针对特定用户提供服务的。那些最流行的项目包...

3258
来自专栏机器之心

教程 |「世界模型」实现,一步步让机器掌握赛车和躲避火球的技能

1275
来自专栏机器学习-数据挖掘

基于日志分析的母机故障定位 ——机器学习应用

随着腾讯云业务的扩大,母机数量越来越多。为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析...

2154
来自专栏大数据文摘

LSTM之父最新力作:手把手教你训练一个有世界观的AI赛车手 | 论文+代码

893
来自专栏AI研习社

深度学习下的医学图像分析(一)

AI 研习社按:本文由图普科技编译自《Medical Image Analysis with Deep Learning 》,雷锋网(公众号:雷锋网)独家首发。...

4015
来自专栏机器之心

资源 | 用苹果Core ML实现谷歌移动端神经网络MobileNet

选自GitHub 机器之心编译 作者:Matthijs Hollemans 参与:李泽南 6 月 5 日开幕的 WWDC 2017 开发者大会上,苹果正式推出...

2497
来自专栏人工智能头条

从Theano到Lasagne:基于Python的深度学习的框架和库

1491
来自专栏ATYUN订阅号

Meltdown漏洞和KPTI补丁如何影响机器学习性能?

在2018年初,互联网领域发现了两大系统漏洞,影响了主要的处理器厂商,这两大漏洞分别是“Meltdown(熔断)”和“Spectre(幽灵)”。这些漏洞是处理器...

3257
来自专栏机器之心

业界 | 谷歌开放语音命令数据集,助力初学者利用深度学习解决音频识别问题

选自Google Research 机器之心编译 参与:路雪 近日,谷歌开放语音命令数据集,发布新的音频识别教程,旨在帮助初学者利用深度学习解决语音识别和其他音...

29111
来自专栏量子位

搞自动驾驶汽车很复杂?其实一个浏览器就行(讲解、代码全都有)

作者:janhuenermann 编译:量子位(QbitAI) · 问耕 自动驾驶高大上?其实在浏览器里也能玩。 上面那个视频是一个2D环境下的无人驾驶系统,...

2715

扫描关注云+社区