本文来自SPIE论文展示,论文标题是“Review and comparative analysis of parallel video encoding techniques for VVC”。
本文论文来源链接:
https://doi.org/10.1117/12.2569283
会议:
SPIE OpticalEngineering + Applications, 2020
在本文中,我们回顾并总结了有关视频编码并行化的研究结果,主要侧重于在块或内部块级别运行的中粒度方法。在适用的地方说明了分类法,重点放在可伸缩性问题上。给定报告的结果,我们将注意力转移到为编码器执行的并行任务分配资源(处理核心)以实现高加速的问题。我们主张,与独立方法相比,利用独立编码区域(例如图块),每个区域内的波前并行度和CTU压缩级别的内部块并行度的并行化方案可以实现更高的并行度。然后提出一种算法,该算法在所有上述级别上进行资源分配决策。在VTM 6.2中,使用CU拆分并行性记录的CTU编码时间,根据可伸缩性评估了提出的算法和来自相关文献的独立代表方法。结果表明,该方案的潜在可扩展性超过了替代方案。
视频编码无疑是一项计算量巨大的任务。因此,并行性已被用来控制复杂性。文献中提出的技术根据任务的粒度分为三大类。粗粒度并行处理涉及帧级别和图片组(GOP)级别的并行化,因此将整个帧或GOP的编码视为不同的任务。细粒度方法考虑了单个块的编码过程中的并行化特定步骤,例如CU分割,运动估计等。因此,我们将它们称为内部块并行方法。最后,在粗粒度和细粒度级别之间,基于块的方法通过将一个或多个块的编码视为任务工作负载来解决中等粒度问题。该类别中最突出的示例是切片,切片和波阵面,它们是HEVC [3]提供的编码工具,并将包含在即将发布的VVC标准中[1]。
在本文中,我们将注意力转向细粒度和中等粒度的并行化方法,这些方法旨在减少单个帧的编码时间。我们提供了针对编码方面的概述和相关研究分类,特别关注了针对最新视频编码标准(主要是HEVC)派生的解决方案。由于预期的VVC标准与其前身相比具有更高的计算复杂性,因此有效的并行化方案变得越来越重要。然后,我们主张结合使用中粒度和细粒度并行方法最适合处理额外的计算开销。这涉及将波前并行度(WPP)应用于帧被划分为例如瓦片的每个独立编码区域,并且将内部块并行度应用于多个WPP操作中的每个CTU的处理。尽管如此,为了实现潜在的潜在资源分配问题,必须确定应该将多少个处理核心(可互换地称为处理器)分配给计算的哪一部分。