AV1显著超越H.265和VP9?—MSU最新比较公布

前言

最新的编码质量对比研究表明,视频编码标准AV1在质量已经登顶,但在编码速度方面仍与VP9、HEVC相差甚远。同时,莫斯科国立大学(MSU)开启了一项从主观层面对比视频质量的服务,名为Subjectify.us。

MSU的研究表明,仅考虑编码质量时,AV1的性能已胜过HEVC和VP9,成为目前质量最高的可用视频编码标准。同时发现,在常规操作模式下,VP9相比于HEVC也有更好的编码质量。不过,以上仅是MSU 2017编码对比报告中诸多亮点的一小部分,除此之外,MSU开展了在线对比视频与静态图像主观质量的服务,并对于SSIM在运用于度量编码质量的测试时需作出的调整问题有了一些新的发现。

MSU从06年就已开始在编码质量对比领域进行深入研究,并在15年公开了HEVC与其他标准比较的成果。近年来,MSU继续利用多类视频/图像文件,多种测试方法,多种解码器不断更新出编码对比测试的版本。MSU今年将对比报告分为五个部分,每部分的大体内容如下所示:

图1 MSU报告概述

AV1标准将逐渐盛行

这部分将针对上图中的Part.5进行展开描述。其中,图2为解码器客观质量对比中最具总结性的图表。从图中可看到,在编码质量相同的情况下,AV1标准仅产生相比于x264 55%的数据量,其次是三通道和二通道Placebo模式下的x265标准,分别产生67%和69%的数据量,然而这两种模式在编解码中并不多见。

同时,报告中对于编码速率也提出了明确的说明:“AV1的编码速率低于其他编码标准2500-3000倍不等,x265的Placebo模式与其他标准的差别有10-15倍”。但MSU发现,AV1还未被完全优化,这也意味着AV1距离实际的投入使用还需要一段时间。

图2 各类编码标准质量对比

MSU在对比时对VP9采用了最慢以及次慢的编码配置,这两种配置常被用于实际的数据传输。VP9呈现出了略优于x265双通道模式的性能,在对比,阐明系统参数的过程中,MSU也常向编码解码器的开发商咨询确认,并会采用一些开发商实际使用的参数进行测试。最终得到一个严谨的结论:在利用31个高清视频样本和独立的第三方配置条件下,VP9比HEVC有更好的质量表现。

Subjectify.us产生的主观测试结果

今年MSU的报告中第一次包含主观测试结果,系统效果如下图所示。Subjectify.us允许用户上传不同类型的图像或视频,并处理用户的主观评价。在测试期间,用户需要频繁点击以保证他们测试的专注程度。

例如,一次测试会出现10个样本,每个样本会有原始样本和压缩样本,显然,原始样本在主观质量上总优于压缩样本。如果用户在这类对比上产生了错误的判断,则认为他们的测试结果无效,并终止他们的测试。

图3 Subjectify.us系统界面

MSU通过Subjectify.us收集了325人次的11530次对比结果,MSU团队折算后的主观评分计算出平均比特率的评分。下图则展示了主观评分对于HEVC编码器整体评分(包含速率)的影响。

图4 HEVC编码器整体得分

从目前的各类成果来看,主观测试费时费力费财,因而Subjectify已是一种研究者或开发商选取编码方式的良好途径。

Tune SSIM

最后一项有意义的发现是关于编码配置tune SSIM的。这是源于x264和x265开发者发现,单一的用于提高主观质量的解码工具会引起客观指标如SSIM、PSNR数值的下降。所以开发者通常放弃这类指标中影响视觉质量的调整,使得两者协调一致。

以下是来自x265文件的建议:“SSIM/PSNR调优的选项会禁止一切以牺牲视觉质量为代价的指标优化”。据此,x265中常以可到达的最高视觉质量为基准进行调优。

同样,也可以以SSIM为基准进行调整,但这可能会使主观评分急剧下降。然而,MSU的研究发现了相反的结果,特定调整后的x264/x265编码性能反而比未调整前更好,结果如下所示。

图5 SSIM调整前后质量对比

MSU的这一结果实际上是在1Mbps至4Mbps之间传输1080p视频的条件下得到的,对此,x264的开发者是这样回应的:

“1-4Mbps对于1080p视频的解码来说是较低的比特率,此时会产生铃铛效应或者区块效应,这本身就降低了主观质量,因而以牺牲视觉质量为代价的客观指标调整需在高比特率条件下进行。同时,SSIM的调整也分为两种模式,一种模式因其自适应性并不需要太多的变形,而另一种则相反,因而不同类型的调整也会影响最终的结果。”

但实际上,4Mbps对于1080p视频的传输来讲已不算太低,这使得利用客观指标对比编码质量的研究变得迷茫,研究者究竟应该用什么范围的速率进行SSIM调整的测试研究?对此,x264开发者认为或许对每个源均进行变形的方法可以得到理想的效果,但这也会引发指标计算需简化的问题。

由此,MSU的成果带来了一个利用SSIM和PSNR比较传输速率跨度较大的视频集时的有效性问题。对于这个问题,或许更先进的指标,如VMAF,可以避免这样的冲突,又或许只能通过主观对比才能消除这种矛盾。众多相关领域人员也希望接下来的几个月甚至更长的时间能有团队解决这个难点。

参考自:

http://www.streamingmedia.com/Articles/News/Online-Video-News/AV1-Beats-VP9-and-HEVC-on-Quality-if-Youve-Got-Time-says-Moscow-State-122945.aspx

http://www.streamingmedia.com/Articles/Editorial/Featured-Articles/Moscow-State-Releases-First-HEVC-Comparison-107455.aspx

原文发布于微信公众号 - 媒矿工厂(media_tech)

原文发表时间:2018-01-31

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量子位

TensorFlow开发者会峰会:支持Swift,更好的支持JavaScript

今天凌晨,2018年TensorFlow开发者峰会(Dev Summit)在美国加州召开。

732
来自专栏灯塔大数据

对比深度学习十大框架:TensorFlow最流行但并不是最好

引 言 2016 年已经过去,BEEVA Labs 数据分析师 Ricardo Guerrero Gomez-Ol 近日在 Medium 上发表了一篇文章,盘...

3616
来自专栏BestSDK

35个免费又实用的开源 AI 项目

1. ACT-R:ACT-R由卡内基·梅隆大学开发,它既是人类认知理论的名称,又是基于该理论的软件的名称。该软件基于Lisp,提供详细的说明文档。 链接:ht...

4248
来自专栏腾讯技术工程官方号的专栏

基于语义关联的中文查询纠错框架

本文作者:内部搜索平台部推荐中心组长,2009年加入腾讯,从事搜索相关工作,包括社区问答,网页搜索,音乐、视频、应用宝等项目,方向涉及query理解,文本相关性...

68110
来自专栏达观数据

技术干货 | 达观数据新用户推荐的三大利器

推荐系统需要根据用户的历史行为和兴趣预测用户未来的行为和兴趣。但对于新用户而言,没有任何的用户行为,如何进行最有效的推荐呢?这就衍生了用户冷启动问题。 在当下...

3003
来自专栏数据派THU

独家 | 这15个最热门的GitHub库你不可错过!

原文标题:15 Trending Data Science GitHub Repositories you can not miss in 2017 作者:SU...

2298
来自专栏PPV课数据科学社区

机器学习及大数据相关面试的职责和面试问题

? 目录 · 机器学习、大数据相关岗位的职责 · 面试问题 · 答题思路 · 准备建议 · 总结 各个企业对这类岗位的命名可能有所不同,比如推荐算法/数据挖掘...

3297
来自专栏大数据挖掘DT机器学习

Microsoft 神经网络分析算法(实操篇)

前言 本篇将是一个实操篇,我们将要总结的算法为:Microsoft 神经网络分析算法,此算法微软挖掘算法系列中最复杂也是应用场景最广泛的一个,简单点讲:就是模拟...

3627
来自专栏MixLab科技+设计实验室

解读:如何让机器自动答题?

冲顶大会、芝士超人、百万赢家、百万英雄……搜狗推语音搜索答题外挂。今天我来总结下利用搜索来答题的技术原理。 本质上,这是一个自动问答( Question Ans...

36010
来自专栏CDA数据分析师

专栏 | 案例:电信用户分群精准画像的7个步骤

“每天一个数据”分析师新一期内容奉上,请享用~ 转载请注明来自CDA数据分析师 否则小编将举报到底! 本期我们有幸采访到的嘉宾名叫兰锦池,2012年硕士毕业,...

2559

扫码关注云+社区