HDR关键技术:HEVC/H.265编码方案

摘要:

前文我们对HEVC的HDR编码优化技术做了介绍,侧重编码性能的提升。本章主要阐述HEVC中HDR/WCG相关的整体编码方案,包括不同应用场景下的HEVC扩展编码技术。

背景

HDR信号一般意味着使用更多比特,一般的HDR信号倾向于使用10比特。这代表着更多的量化阶数,不同阶之间更平滑的过渡,但这也意味着更高的带宽和存储需求。未压缩的单个HDR像素需要12个字节的内存来存储RGB值的三个单精度浮点数。未压缩的4K UHD分辨率(3840×2160像素)的单个HDR帧需要大约94.92M字节的存储,并且每秒30帧的一分钟数据需要166G字节。如果没有压缩,会给存储和传输带来巨大的压力。虽然地面宽带的带宽经常增加,但即使这样也不足以在未来播放任何未压缩的HDR电影,因此对数字信号进行压缩是进一步的需求。

HDR视频的标准中,最常用的是由BDA(Blu-ray Disc Association)支持的HDR10标准,这是最早支持HDR视频的几种标准之一。HDR10标准包含的内容有:使用PQ电光转换函数和BT.2020标准中的色度空间,10比特的非恒定亮度Y’CbCr空间,4:2:0的色度抽样方法,压缩方法采用HEVC Main 10配置文件。在实际应用时,HDR10中还应该包括一些常用的元数据,比如Mastering Display Colour Information或者Content Light Level Information等。

2013年7月,MPEG开始针对HDR和WCG内容分发的需求,展开探索性的实验,打破了视频压缩和处理链的各部分,转换函数被分离研究,不同的颜色表示格式测试各种抽样方法,并且做了一些主观视频质量测试方法和客观视频质量测试指标。MPEG最初的重点是高质量的应用程序,但后来扩大到包括广播,流媒体和存储应用程序。随后,MPEG于2015年2月发布了证据征集(CfE),并于2015年6月报告了对技术响应的评估。CfE的目标是评估当前HEVC标准的HDR和WCG视频的压缩性能,并确定是否应考虑其他有前景的技术以用于HEVC的未来扩展。

HEVC编码对HDR/WCG的支持

在H.265/HEVC针对HDR和WCG的CfE中,得到了两种类型的解决方案:一种是单层的HDR编码方案,包括元数据的使用,但并不需要对落后的SDR设备的向后兼容性;第二种明确的关注对SDR设备的兼容性,使用单层或多层的编码方案。这里指明的对SDR的向后兼容性不仅包括对现有编码器,也就是HEVC Main 10的兼容,也包括了对现有的SDR显示器的兼容。对于单层HDR编码,作为对比的参考技术是HEVC Main 10;对于多层HDR编码,参考技术是SHVC Scalable Main 10。HDR和WCG技术需要的位深至少为10bit,在电视制造业中,HEVC Main 10已经广泛应用在UHD视频中。因此,HEVC Main 10已经作为由CfE提出的技术中的单层案例的方法和可分级案例中的基础层。

第一和第二版本的HEVC标准已经包含了几种可应用于HDR和WCG视频的工具,包括支持HDR信号传输和BT.2020色域的HDR视频信号格式、用于支持HDR信号在接收端转换显示的补充增强信号(SEI)信息的定义和支持更高位深视频编码的应用。除此之外,HEVC的可分级扩展(SHVC)还包括色域可扩展性(CGS)和位深可扩展性(BDS)工具来解决针对SDR BT.709的向后兼容性。表一概括了HEVC编码器中为HDR和WCG提供的一些工具,而这些工具将在接下来的几个部分分别介绍。

表1 HEVC中HDR/WCG工具

2.1 VUI

VUI(Video Usability Information)是在H.264/AVC和H.265/HEVC序列参数集中携带的元数据元素的集合,它们共同描述了实际视频信号如何在样本流内存储和映射。术语“视频信号容器”起源于早期的电视和电影工程,早于文件容器概念。VUI传达视频信号的含义,特别是整数视频采样值如何最终转换为线性显示强度,通常表示为0到1.0的浮点数信号乘以传递函数的强度范围,例如SDR视频的100nits和HDR视频的10000nits。普通数字电视信号是经过量化的一系列样本,它们拥有各自的以下属性:比特深度、非线性(Gamma)映射和导数颜色空间,以及附加属性比如色度亚采样方式。HEVC视频编码的研究者通常更多的关注视频信号容器的属性,而不是视频编解码器及其参数,编解码器通常被当作“黑箱”来使用,它通过临时压缩,变为用于传输的视频信号,然后由解码器来解码和重新渲染为原始视频信号的表示,最终保持视频编码之前信号容器的原始含义。诸如格式转换和显示处理之类的解码后处理与VUI容器属性高度相关,以优化视频信号在目标显示器上的渲染。同样,VUI容器的属性显著影响了视频信号格式转换的效果,因此为了得到内容的预期效果,对VUI中元数据的正确设置显得至关重要。图1给出了VUI和SEI元素在渲染过程即后处理过程中可能有应用的地方。接下来将介绍关键VUI比特流元素,其规范中的名称用斜体显示。

图1 VUI和SEI信息在渲染过程的应用

2.1.1 原色

视频中的原色可以由实际的CIE的xy坐标表示为0-1的数值,这个属性基本上建立了视频信号包含的色域的边界。关于WCG,HEVC在VUI中包含两个新条目,以支持BT.2020和XYZ颜色原色。如由CIE xy坐标规定的主要三角形轨迹所示,该区域可以在colour_primaries的指定值之间自由选取,并且BT.2020拥有两倍于BT.709的色域范围。

2.1.2 传递函数

传递函数建立了样本量化值(0到

之间的整数)与亮度显示器上的亮度(以nit为单位)的映射关系。VUI指示符transfor_characteristics通常对应于参考的SMPTE或者ITU-R标准的特定方程,其被应用于将原始视频线性信号转换为非线性信号,比如传统的用于SDR BT.709的Gamma 0.45函数。大多数的传递函数将线性信号转换成更紧凑的非线性信号表示,然后用编码器进行压缩。线性信号一般有均匀的量化步长,因此占用的比特数比较多,不适用于低码率为主导的信号传输,例如,BT.709中的逆Gamma传递函数将非线性8位信号扩展到0.1到100尼特范围内大约11位的线性光信号,这也从侧面显示了传递函数带来的码率节省。

新的PQ传递函 数比通常使用的Gamma传递函数更适用于HDR视频信号,并且最近被添加到了VUI的传输特性表中。PQ是Barten等人针对人类视觉模型对对比度敏感的特性来设计的,其被收录在ST.2084规范中。

图2 传递函数对比

PQ传递函数与其他各种传递函数的对比如图2所示,该图的纵轴是亮度级别取log10的数值,单位是尼特,横轴是视频的整数样本的编码级别。作为对比,图中的绿色曲线代表了传统的用于8比特SDR视频的传递函数,蓝色曲线是用于10比特HDR视频的PQ传递函数。如图5所示,8比特SDR仅仅覆盖了0.1-100尼特的范围,而10比特HDR仅仅通过额外的两个比特,覆盖了0.00005~10000尼特的范围。对于BT.709 SDR中能使用8比特(16-235)表示的亮度范围0~100nits,PQ使用了9个比特(120~510),另外一个额外位有效的提供了低于0.1nits的较暗处细节,而这些细节映射到64~119的量化值范围。而亮度大于传统SDR信号限制的100nits的部分被映射到511~940的量化值范围。需要注意的是,与专业的10比特SDR BT.1886/BT.709信号容器相比,对于0.1-10nits的信号,PQ曲线密度相对较大,但这是一个权衡,对于10~100nits的信号,PQ传递函数的曲线更加稀疏。

2.1.3 颜色空间

非线性/近似感知统一的编码视频信号的实际域,从由上述传递函数和颜色原色的组合指示的非线性/感知统一的主视频信号导出,最常见的衍生色彩空间类似Y’CbCr。除此之外,AVC和HEVC认为编码的视频信号是原始信号,例如4:4:4 RGB或XYZ,原始信号的编码在专业应用中是很常见的,例如相机主机或存档视频的夹层压缩。为了能够给出像Y’CbCr空间和4:2:0的采样比这样更加能量紧凑的色差空间同工的一些比特率上的优化,HEVC第二个版本添加了交叉分量预测(Cross-component prediction, CCP)工具,基本思路是在解码重建的循环中,将原始信号分解为类似于Y’CbCr这样的不相关的几个分量,并用于预测。因此,CCP是编解码器内部对AVC或HEVC编码之前应用于主信号的通常外部色差导出的内部替代方案,然后在AVC或HEVC解码之后通过逆操作处理得到原始信号的近似。

2.1.4 量化范围

量化范围定义了非线性编码的视频信号范围是否利用了从0到

内所有可用的量化代码级别,或者被缩放到某个子集用以提供足够的用于信号负脉冲的空间和用于信号过冲的空间,用于存储通过从滤波器或编解码器量化产生的噪声。消费市场中的视频应用通常需要的是非全范围模式,例如,10比特下常常将0到1之间的实数非线性信号值映射到量化值为64-940的亮度范围和64-960的色度范围。对比之下,传统的8比特视频信号的亮度量化范围是16~235,色度是16~240。

像所有VUI元素一样,video_full_range_flag是在HEVC和AVC标准范围内的信息元数据,因此不影响任何内部解码操作,解码器仅需要将完整的动态范围内存储的输出视频和图像剪辑到内部解码图像缓冲区,用作后续解码图像的运动预测参考。解码器不会通过语法元素video_full_range_flag,将视频映射到包含的任何较窄的范围,而是将该VUI元素传递到最后用于显示器的处理。

在MPEG HDR和WCG特设组进行的实验中,以及Ultra HD Blueray项目的多个调查中显示,10比特PQ BT.2020的HDR、WCG信号的编码比特率是与用于SDR编码比特率相同的数量级,以PSNR为评价标准的HDR和SDR保真度也很接近。在测试序列中,HDR技术主要体现在艺术效果中,例如镜面高光、霓虹灯和分散在黑暗场景中的高对比度光和火焰,实际场景的平均亮度级别被设置为与SDR视频中的平均亮度接近。除此之外,AVC和HEVC在具有精细细节的镜面高光和高对比度边缘形状会使用更精细的四叉树划分(比如使用4x4块)。与进行传统变换量化对比,PQ方法进行更精细的划分,有更少的残差和边信息,因此带来的性能损失(开销)很少。

2.2 SEI信息

SEI是Supplemental Enhancement Information的缩写,是用来保证SDR与HDR之间的互用性的机制的方法,用于实现在接收器或者播放器中实现直接显示或转换显示的过程。色调映射是将HDR信号转换为较低动态范围的过程,而反色调映射是它的逆过程,旨在增强输入信号的动态范围和色域。这些过程通常由伴随着主视频流的元数据驱动,在创建内容和分级时生成。HEVC标准包含几种SEI信息,可用于SDR和HDR之间和正常色域与宽色域之间的正向和逆向转换。

HEVC标准的附录D中给出的Mastering Display Color Volume SEI Message对应了第一类型的指定表征内容参数的元数据,这些参数是内容描述性的,与解码信号后的具体处理无关。这种元数据表示了内容生成时监视器的实际色域和动态范围,色域和亮度动态范围的乘积空间被称为“颜色容量”。通常情况下,彩色视频的摄影师进行视频调整的创作端的母带监视器旨在代表接收端的现实目标,在实践中,母带制作显示器的颜色容量是编码的视频信号容器颜色容量的子集。例如,如果分级监视器仅呈现BT.709色域,但是信号容器指定了更大的BT.2020色域,那么掌握显示颜色容量SEI信息中的参数就将指示BT.709空间的属性,也就是BT.709的原色xy坐标和白点,SEI信息还包含了显示器的最大最小亮度。知道母带监视器的子集范围会帮助到优化编码视频在显示设备上的显示效果,这可能与母带制作中使用的不同。另外,在接收端测量编码视频流实际使用的颜色容量也是可行的,但这种分析会导致额外的延迟,潜在地需要从开始到最后完整地传递内容以建立内容的可信赖的配置文件。

第二种元数据可以更具体的用于自适应过程,这些元数据嵌入了控制色调映射和反色调映射的参数。他们通常针对特定的后处理过程,例如通过查找表组合的信号转换和经由3×3矩阵的颜色空间转换。与上述的描述性元数据相反,这种元数据可以认为是处理控制和参数的元数据,例如图3中的元数据就可以被用于保证HDR转换得到的SDR信号符合本来的艺术层面的意义。这一类别的元数据,HEVC规定了三种SEI信息:tone mapping信息、颜color remapping信息(CRI)和knee function信息。

图3 HDR向SDR转换时CRI的应用

Tone mapping的SEI信息被设计为携带编码视频序列内的一个或多个色调映射曲线,色调映射曲线用于在显示器上显示解码图像数据,该表达式通过导出在SEI信息中转录的一维查找表并将得到的表应用于解码信号的RGB分量来进行算术实现。为了提高编码效率,在系统中的一维查找表给出了四种方式:线性模型、S形模型、分段线性模型和显式查找表模型。选择前两种的方法可以简化通用色调映射行为特征的信令,后两种方法允许更多的任意映射,但是具有更高的比特率上的潜力。在系统的设计中,重要的是要注意通过色调映射信息SEI消息标识符标签可以将多于一个色调映射与视频编码序列相关联。这使得系统可以同时支持多个动态范围目标,包括具有比解码的视频数据更大或者更小的动态范围的目标。该信息对应tone_map_id参数。该参数使得能够存在和维护多个色调映射信息SEI消息。而且,应用程序可以使用该参数来识别所包括的色调映射。用于识别色调映射的目的第二种机制是对存在于比特流中的每个色调映射的编码数据位深和目标位深的信令。编码数据比特深度指示SEI消息所针对的编码视频序列的比特深度。当该值与比特流中的数据的比特深度相同时,则可以将特定色调图视为使用的候选。或者,当编码数据比特深度值与比特流的比特深度不匹配时,则色调映射图可以被认为是假设的(一种情况是该序列经过了转码或在传输系统内已经进行了色调映射操作)。类似地,色调映射图可以与不同的目标比特深度相关联。该信息指示接收设备或显示器的位深度要求。

颜色重映射(CRI)SEI信息是用来保证转换的HDR和WCG与SDR信号内容不失真,适用于在生产、后期制作方面制作两个分级版本的内容时。CRI元数据源自这两个分级版本,并传送到解码器,那么在后处理步骤中可以确保符合艺术意图的转换。重映射模型适用于信号的三种颜色分量信号,例如RGB或Y’CbCr。初始模型基于应用于图像的三个颜色分量样本的三维查找表。后来过程被简化,但是没有明显处理质量上的影响,以适应当前消费电子设备显示能力上的限制。最终版本基于三个一维分段线性输入查找表(LUTin0, LUTin1, LUTin2),随后是一个能够进行颜色空间转换的3×3矩阵,紧接着三个一维分段线性输入查找表(LUTout0, LUTout1, LUTout2)。以下等式说明了该模型在颜色样本RGB值中的应用:

这三个步骤的每一步都是非强制的,例如在只有一个输入信号的传递函数对每个颜色分量的应用中,只有第一个一维查找表可以适用。由于输入和输出的位深可以不相同,因此该模型可以支持SDR与HDR的转换和不同色域之间的转换。

Knee function SEI信息可以被认为是上面Tone mapping SEI信息中第三种可分段线性函数的简化版本,分段点在此定义为拐点。例如图4中给出的简单模型,该模型只包含三个拐点,说明了一个典型的S形曲线是如何通过拐点函数设计,来实现由一个1000nits HDR输入信号映射到预期为100nits SDR信号的输出信号。HEVC提供的SEI信息中可以支持最多999个拐点的拐点方程。

图4 S形knee function示意图

2.3 SHVC中的编码工具——CGS、BDS

SHVC是HEVC编码的可分级扩展功能,为了保持SHVC的低执行成本,没有引入新的块级编码工具。为了减少层间冗余,在编码增强层处采用上采样的基本层来重构图像作为层间参考图像。HEVC的设计通过使用分层时间预测结构的时间子分层特征来支持时间可扩展性,SHVC提供了额外的可扩展功能,包括位深、空域、质量、隔行扫描到逐行扫描、色域和标准(例如具有HEVC增强层的AVC基础层)的可扩展性,允许支持具有SDR后向兼容性的HDR和WCG信号。

色域可扩展性(CGS)表示基本层和增强层各自具有不同色域的情况下可扩展使用的例子。例如,DVB Phase II定义了一种具有8比特BT.709色域的HD内容作为基础层的场景,以及增强层中10比特BT.2020色域的UHD内容。显然,在两层之间不同色域特性的直接层间预测无法在CGS场景中工作,因此SHVC开发了CGS的特殊编码工具,为SHVC发布了两个配置文件:Scalable Main profile和Scalable Main 10 profile。其中Scalable Main 10 profile支持CSG相关编码工具。

CGS的一般过程如下:首先,将配置的基础层重建图像映射到增强层的色域;然后,将映射图像(按需使用上采样)用作当前增强层图像的解码时的层间参考图像,就其本身而论,映射过程就是色调映射,实际上是作为SHVC中CGS的编码工具引入的唯一新模块。在CGS编码工具开发初期,对采样过程和色调映射过程的顺序进行了深入研究,以找出编码性能与编码复杂度之间的最佳权衡。SHVC采用的流程在上采样之前进行色调映射,可以大大降低色调映射的计算复杂度,编码性能上只有不到1%的损失。

在颜色映射算法设计中有三个主要的元素:基于不对称三维查找表的CGS、非均匀色度内容分割和亮度和色度分量之间的相位调整。与不使用CGS工具的实验对比,这三个元素的应用在不同的测试方案下,可以有10%到15%的BD-rate上的优化。

图5 左:非对称3D LUT;右:非均匀色度分区

不对称三维查找表是在对称3D LUT基础上提出的,目的是为了在保持小型LUT的同时实现准确的色彩映射,基底层颜色空间被分割成多个相同大小的长方体分区,其中亮度分量比两个色调分量更细,如图5中左图所示。对于每个长方体分区,使用以下模型的线性交叉颜色预测,其中(Yb, Ub, Vb)表示基本层色域中的一个像素的三色分量,而(Ye, Ue, Ve)表示相关像素在增强层色域中,a和b表示映射参数。在配置文件Scalable Main 10中可以支持多达8×2×2长方体分割,由此LUT项的最大量可以达到384(8×2×2×4×3),相对于对称的3D LUT方法来说数量少了很多。

非均匀色度分区是在了解到色度分量的样本值通常分布不均匀的事实,而提出的。图5的右侧图呈现了不均匀色度分割的例子,作为参考,均匀色度分区由虚线表示。为了定位色度分区边界,相对于虚线中的均匀划分的偏移在比特流中用于两个色度分量的信号。

相位调整是为4:2:0的色度格式输入视频的特别设计,在这种情况下,色度分量的空间分辨率是在水平和垂直方向上的亮度分量的空间分辨率的一半。此外,色度样本位置通常与亮度样本位置不对齐。HEVC标准中的VUI定义了六个色度位置类型以指定相对于亮度样本位置的色度样本位置。CGS中的相位调整集中在几种最常见的情况,如图6所示。

图6 4:2:0色度模型的常见模式

图6给出了一种典型的邻域亮度和色度样本的设定,是由BT.709规定的4:2:0色度格式。然而,在BT.2020中,色度采样位置与亮度样本位置的对应关系是色度格式4:2:0,亮度样本位置用Y表示,色度采样位置用C表示。为了将不对称的基于3D LUT的颜色映射应用于这三种颜色分量中的任意一种,需要输入一个三元数组(Y, U, V)。为了提高颜色映射处理的精度,在使用交叉颜色分量进行操作之前需要将不同颜色分量的样本位置对齐。具体而言,当计算亮度分量的色彩映射输出时,色度采样值被调整为与它们应用的对应亮度样本位置对齐。将C表示为输入色度样本U或V之一,Y表示输入亮度信号,根据Y所在的位置,使用简单的2抽头或4抽头滤波器调整C的值,方法如下:

类似的,当计算色度分量的颜色映射输出时,调整亮度样本值以与它们应用的相应色度采样位置对准。也就是说,根据c所在的位置,使用简单的2抽头滤波器调整y的值,方法如下:

SHVC有灵活的方式通过有效的信令来支持位深的可扩展性(BDS),CGS中的颜色映射过程以CGS参考信号输入和输出的位深,这样也可以支持BDS。SHVC中的上采样过程通过调整上采样内的位移数量,根据需要对输入和输出之间的差异进行补偿。支持BDS的一种方法是简单地通过相应地制定输入和输出位深来应用组合位深转换和空间分辨率转换的上采样过程,过程很简单,不需要考虑上采样过程的输入和输出之间的颜色特征的变化。这一方法的层间过程在图7(a)给出,用于CGS、BDS和空间组合可扩展性。第二种选择是将位深转换过程和色域转换过程组合在一起。第二种方法的层间过程由图7(b)给出,与第一种方法相比,第二种方法可以保持足够的转换精度并具有更好的编码性能。

图7 SHVC层间处理过程

其他相关编码方案

前面内容介绍了当前HEVC标准中包含的HDR/WCG相关的编码技术。在本节中,简要介绍在HEVC标准扩展过程中提出的一些代表性编码相关技术。

3.1 替换颜色空间

在传统方法中,视频编码使用Y’CbCr颜色空间,该颜色空间的目的是对R,G和B颜色分量进行去相关。在SMPTE ST 2085中标准化的新YDzDx色差空间被添加到HEVC版本3中的VUI [1] 。YDzDx通过对XYZ原始信号的差分矩阵求导获得,其方式与Y’CbCr从RGB导出的方式类似。从XYZ颜色空间到YDzDx空间的变换如下指定(Y分量与XYZ颜色空间中的Y一致):

c1和c2是常数,旨在改善由色度下采样和量化噪声产生的白平衡偏移。在过去十年中,类似的XYZ色差衍生空间已被用于数字电影应用中。YDzDx允许XYZ视频通过4:2:0设备链,与4:4:4色度格式的XYZ直接编码相比,提供一点额外的编码性能。电影制片厂XYZ主要空间的主要动机是提供更加面向未来的色彩坐标系统,通常用于工作室制作工作流程,根据定义,它完全包含人类视觉的视觉范围,从而避免单独的渲染和分级,也避免了随着时间推移颜色空间的逐步增加。

针对色调线性度优化的其他色彩空间,例如CIELAB和IPT [2],[3],近年来也在持续针对HDR和WCG图像和视频编码进行一些研究。

3.2 替换编码框架

已经有许多与HDR内容的编码有关的工作,主要基于色调映射操作以将HDR信号变换为8或10位整数低动态范围(LDR)信号。这些方法可以分为三类。

第一类是基于比特深度的感知域中的HDR信号的表示,其高于应用于SDR视频的通常的8比特(参见[4],[5])。传递函数的研究属于这一类。该类工作一般使用单层解决方案对得到的转换信号进行编码。

第二类基于调制原理,并使用两个层(参见[6],[7])。基础层是SDR视频,附加层包含调制信息。在解码器侧,将解码的LDR内容乘以解码的调制比以重建HDR内容。

第三类还使用两个层,其中基于逆色调映射的层间预测来预测来自LDR基础层的HDR层。预测残差被编码为增强层(参见[8] - [10])。即使从概念上讲它们可以应用于HEVC,这些工作最初也是基于MPEG-2或AVC。

除了已经在HEVC中指定的技术之外,JCT-VC也收到几个候选解决方案以用于HDR和WCG支持。这些提议目标各不相同,比如,比现有的基于HEVC的编码链改进编码效率,比特流与传统解码器的向后兼容性,以及解码视频与传统显示器的向后兼容性。 大多数提案仅影响编码和解码过程之前和之后的预处理和后处理步骤,因此不影响HEVC规范的核心编码工具。 然而,其中一些提案可能需要另一个配置文件,而不是HEVC main或main10配置文件。

结合较小位深度实现的高位深度编码的问题在[11] - [14]中得到解决。常见的想法是重用HEVC 8(或10)位设计来编码更高位深度的内容,而无需例如在各种变换级,量化和熵编码级中扩展内部寄存器的位深度。

图8 低比特深度编码器进行高比特深度信号编码

如图8所示,通过分割高位深度的最高有效位(MSB)和最低有效位(LSB),首先将输入HDR图像转换为有限位深度的两个图像(通常每个分量8位)样本。考虑到MSB和LSB之间的差异,编码过程中采用自适应量化调整。MSB部分被编码为主图像,LSB图像被编码为辅助图像。该工作使用SEI信息以在解码器处组合MSB和LSB部分。

图9 将HDR图像(顶部)分解为调制图像(左下)和有限深度的SDR信号(右下)

基于信号调制概念的替代解决方案在[15] - [17]中提交给JCT-VC。所提出的解决方案旨在提供改进的编码效率和SDR后向兼容性。原理是,即使图像全局为高位深度或HDR,也可以在局部进行低位深度的分解。该解决方案包括编码前的预处理步骤,将输入信号分成两个独立的低位深度信号,一个调制信号(称为调制图像,为输入信号的低通版本)和另一个有限深度信号(SDR信号)。一旦提取了低频部分,比特深度信号(SDR图像)对应于剩余部分,如图9所示。

图10 调制方法的解码器端

在解码端,相应的后处理步骤(图10中所示)被应用于重构的调制图像和SDR图像以生成输出的高位深度图像。一旦解码的Y’CbCr 4:2:0 SDR信号被解码,则将其重采样为4:4:4色度格式,然后转换为RGB空间。从SDR信号(RSDR,BSDR,GSDR)和调制信号μ重建HDR信号(RHDR,BHDR,GHDR)可以用以下简化的等式表示:

在编码端,调制信号和SDR信号都可以(均由线性光输入HDR信号产生)通过两个不同的传递函数被映射到非线性表示。必须使用逆映射函数fSDR和fModul在解码器侧反转这些操作。组合两个信号的乘法应用于线性光域。完整过程独立地适用于每个像素。

为了在解码端重建HDR信号,该提案还提出了新的SEI信息(调制信道信息SEI信息)以嵌入从解码的调制和解码的SDR图像重建HDR信号所需的参数,该信息还指示输出重建信号的格式。

原文发布于微信公众号 - 媒矿工厂(media_tech)

原文发表时间:2018-07-30

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏QQ会员技术团队的专栏

人人都可以做深度学习应用:入门篇(下)

如果这一轮AI浪潮真的会带来新的一轮科技革命,那么我们相信,它也会遵循类似的发展轨迹,逐步发展和走向普及。如果基于这个理解,或许,我们可以通过积极学习,争取成为...

7.4K2
来自专栏数据结构与算法

中国剩余定理详解

引入 我国古代数学著作《孙子算经》中有一道题目,它的描述是这样的 今有物不知其数,三三数之余二;五五数之余三;七七数之余二。问物几何? 这道题用现代数学理...

38311
来自专栏数据科学与人工智能

【Python环境】scikit-learn的线性回归模型

内容概要 如何使用pandas读入数据 如何使用seaborn进行数据的可视化 scikit-learn的线性回归模型和使用方法 线性回归模型的评估测度 特征选...

2848
来自专栏人工智能

机器学习(五)——k-近邻算法进一步探究

机器学习(五) ——k-近邻算法进一步探究 (原创内容,转载请注明来源,谢谢) 一、概述 现采用k-近邻算法,进行分类应用。数据源采用《机器学习实战》提供的数据...

20310
来自专栏mathor

全概率公式和贝叶斯公式

1355
来自专栏AI研习社

利用摇滚乐队学习TensorFlow,Word2Vec模型和TSNE算法

学习“TensorFlow方式”来构建神经网络似乎是开始机器学习的一大障碍。在本教程中,我们将一步一步地介绍使用Kaggle的Pitchfork数据构建Band...

1672
来自专栏编程

用Python进行速度预测

这次分享一段数据特征挖掘准备工作的套路~ 数据格式是这样的: ? task 预测值:速度 特征值: Region 区域 Length 长度Volume 流...

3349
来自专栏计算机视觉战队

结合人类视觉注意力进行图像分类

注:昨天推送发现内容有一个严重错误,所以临时删除了文章的链接,希望关注的您能够谅解,我们也是希望推送最完整最准确的内容,谢谢您的支持与关注,谢谢! 好久没有和大...

8566
来自专栏AI研习社

用深度学习每次得到的结果都不一样,怎么办?

AI研习社按:本文作者 Jason Brownlee 为澳大利亚知名机器学习专家、教育者,对时间序列预测尤有心得。原文发布于其博客。AI研习社崔静闯、朱婷编译。...

1.4K3
来自专栏PaddlePaddle

技术流|五分钟带你鉴别垃圾邮件

1)邮件样本广告邮件,保存为典型的Spam,分为元数据(发信方、书信方、编码格式等)和正文,提炼代表垃圾邮件的关键词

1071

扫码关注云+社区

领取腾讯云代金券