摘要:
第125届MPEG会议于2019年1月14日至18日在摩洛哥马拉喀什成功举行,会议成果主要包括:MPEG将基于网络的媒体处理(NBMP)的规范推广到委员会草案阶段,发布了关于3DoF+ Visual的提案征集,开始研究新的编码标准MPEG-5 EVC,基于ISOBMFF格式的规范文档和参考软件的开发进入国际标准草案阶段和第二版MPEG-21用户描述规范定稿等。本文总结自MPEG第125次会议报告。
NBMP
在第125次会议上,MPEG将其基于网络的媒体处理(NBMP)的规范提升为ISO / IEC 23090-8的委员会草案。随着媒体服务的复杂性日益增加,将复杂的媒体处理操作转移到云上变得越来越重要,以便保持接收器硬件的低复杂度和低功耗。该标准定义了一个标准化框架,允许内容和服务提供商描述、部署和控制其云中内容的媒体处理。该框架包括一个部署在现有商业云平台之上的抽象层,旨在与5G核心网和边缘计算集成。NBMP工作流管理器是框架的另一个重要组成部分,它允许组合多个媒体处理任务,以处理来自媒体源的传入媒体和元数据,并生成已处理的媒体流和元数据,以准备分发到媒体接收器。该规范将提供一些有趣的应用实例指南,如远程渲染点云数据和引导转码等。该标准将在2020年初定稿。
3DoF+
360度视频支持,也称为全向视频,已经在用于高效视频编码(HEVC)的MPEG全向媒体格式(OMAF)和补充增强信息(SEI)消息中被标准化。这些标准可用于沉浸式视觉内容的编码和传输。然而,渲染平坦的360度视频可能在渲染靠近观看者的物体时产生视觉不适。
“3自由度+”(3DoF+)的交互式视差特征将在有限的观看者运动范围内,为观众提供更接近地模仿自然视觉的视觉内容。典型的3DoF+用例是坐在椅子上的用户,其在头戴式显示器(HMD)上观看立体全向视频内容,能够在任何方向上轻微地移动他的头部。
在第125次会议上,MPEG发布了关于3DoF+ Visual的提案征集(CfP)。目标是开发一个3DoF+视频编码解决方案,该解决方案基于现有的HEVC标准(Main 10 profile)构建纹理和深度信息,其中3DoF+元数据将在MPEG-I第7部分中标准化。它将在OMAF中的系统级别和SEI消息中的视频级别被引用。
MPEG-5 EVC
在第125次会议上,MPEG开始研究一种新的视频编码标准,称为MPEG-5基本视频编码(EVC)。人们对更高效的视频编码技术存在持续的需求,然而,编码效率不是视频编码技术行业参考的唯一因素。MPEG-5 EVC旨在提供标准化的视频编码解决方案,以满足某些用例中的业务需求(例如视频流服务),其中现有的ISO视频编码标准由于其纯粹的技术特性而没有被广泛采用。
MPEG-5 EVC将包括基准配置文件(baseline profile),该配置文件仅包含超过20年的技术或者预计将免版税的技术。此外,主要配置文件(main profile)添加了少量附加工具,每个工具都可以单独地开关或切换到相应的baseline工具。MPEG鼓励为main profile提出建议的组织承诺及时公布许可条款。该提案中的编码标准的目标编码效率要至少达到HEVC的编码效率,而在本次会议上对提案要求做出的答复中,这一目标被超过了约24%。MPEG-5 EVC标准的开发预计将于2020年完成。
ISOBMFF
在第125次MPEG会议上,基于ISOBMFF格式的规范文档和参考软件的开发已经达到了最后阶段,即国际标准草案(FDIS)。该软件使用基于ISOBMFF的格式实现各种标准的功能,例如ISO基本媒体文件格式本身(ISO/IEC 14496-12)、ISOBMFF (ISO/IEC 14496-15)中的网络抽象层(NAL)单元结构化视频的传输、ISOBMFF (ISO/IEC 14496-30)中的时控文本和其他视觉覆盖、HEVC的图像文件格式(ISO/IEC 23008-12)和全向媒体格式(ISO/IEC 23090-2)等。
随着文本标准的发展,该软件开发将通过GitHub继续进行。本标准还提供了有关ISO/IEC 14496-12、ISO/IEC 14496-15、节能介质消耗(绿色元数据)(ISO/IEC 23001-11)和ISO/IEC 23008-12的规范文档。
项目Github:https://github.com/mpeggroup/isobmff
第二版MPEG-21用户描述
随着在第125届MPEG会议上通过批准国际标准最终草案(FDIS),第二版MPEG-21用户描述规范的开发告一段落。ISO/IEC 21000-22用户描述标准定义了四种类型的描述符,使系统能够根据用户的偏好和上下文产生服务的推荐。
(i)用户描述(UD)
(ii)上下文描述(CD)
(iii)服务描述(SD)
(iv)推荐描述(RD)
此版本增加了与新用例相关的技术,如视觉表达,响度控制和隐私保护等。
参考资料
https://mpeg.chiariglione.org/meetings/125