YCbCr数据格式

我们经常会看到4:4:4、4:2:2、4:2:0这样的字眼,比如你的5D拍摄的视频是4:2:0取样压缩的,又比如QuickTime的ProRes422格式,或者专业摄影机拍摄时是以4:4:4取样的。视频压缩通常被认为是数字格式特有的概念,但早在模拟信号时代就有了,数字格式的压缩只是变得更复杂了而已。在这个文章中,我们来看看什么是4:2:2、4:1:1和4:2:0色度取样。

YUV主要的采样格式

  主要的采样格式有YCbCr 4:2:0、YCbCr 4:2:2、YCbCr4:1:1和 YCbCr 4:4:4。其中YCbCr 4:1:1 比较常用,其含义为:每个点保存一个 8bit 的亮度值(也就是Y值), 每 2x2 个点保存一个 Cr和Cb 值, 图像在肉眼中的感觉不会起太大的变化。所以, 原来用RGB(R,G,B 都是 8bit unsigned) 模型, 每个点需要8x3=24 bits(如下图第一个图). 而现在仅需要8+(8/4)+(8/4)=12bites, 平均每个点占12bites(如下图第二个图)。这样就把图像的数据压缩了一半。

  上边仅给出了理论上的示例,在实际数据存储中是有可能是不同的,下面给出几种具体的存储形式:

(1) YUV 4:4:4

YUV三个信道的抽样率相同,因此在生成的图像里,每个象素的三个分量信息完整(每个分量通常8比特),经过8比特量化之后,未经压缩的每个像素占用3个字节。

  下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2][Y3 U3 V3]

  存放的码流为: Y0 U0 V0 Y1 U1 V1 Y2 U2 V2 Y3 U3V3

(2) YUV 4:2:2

  每个色差信道的抽样率是亮度信道的一半,所以水平方向的色度抽样率只是4:4:4的一半。对非压缩的8比特量化的图像来说,每个由两个水平方向相邻的像素组成的宏像素需要占用4字节内存。

  下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2][Y3 U3 V3]

  存放的码流为: Y0 U0 Y1 V1 Y2 U2 Y3 V3

  映射出像素点为:[Y0 U0 V1] [Y1 U0 V1] [Y2 U2 V3][Y3 U2 V3]

(3) YUV 4:1:1

4:1:1的色度抽样,是在水平方向上对色度进行4:1抽样。对于低端用户和消费类产品这仍然是可以接受的。对非压缩的8比特量化的视频来说,每个由4个水平方向相邻的像素组成的宏像素需要占用6字节内存

  下面的四个像素为: [Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2][Y3 U3 V3]

  存放的码流为: Y0 U0 Y1 Y2 V2 Y3

  映射出像素点为:[Y0 U0 V2] [Y1 U0 V2] [Y2 U0 V2][Y3 U0 V2]

(4)YUV4:2:0

4:2:0并不意味着只有Y,Cb而没有Cr分量。它指得是对每行扫描线来说,只有一种色度分量以2:1的抽样率存储。相邻的扫描行存储不同的色度分量,也就是说,如果一行是4:2:0的话,下一行就是4:0:2,再下一行是4:2:0...以此类推。对每个色度分量来说,水平方向和竖直方向的抽样率都是2:1,所以可以说色度的抽样率是4:1。对非压缩的8比特量化的视频来说,每个由2x2个2行2列相邻的像素组成的宏像素需要占用6字节内存。

  下面八个像素为:[Y0 U0 V0] [Y1 U1 V1] [Y2 U2 V2][Y3 U3 V3][Y5 U5 V5] [Y6 U6 V6] [Y7U7 V7] [Y8U8 V8]

  存放的码流为:Y0 U0 Y1 Y2 U2 Y3Y5 V5 Y6 Y7 V7 Y8

  映射出的像素点为:[Y0 U0 V5] [Y1 U0 V5] [Y2 U2 V7][Y3 U2 V7][Y5 U0 V5] [Y6 U0 V5] [Y7U2V7] [Y8 U2 V7]

取样的概念

视觉专家很早以前就知道,人眼对亮度分辨率的敏感度高于对色彩分辨率的敏感度。

这就是早期模拟和数字压缩形式的主要动因。视频信号会分解为亮度和色度,这两个是组成色彩的元素,这类似于图像可以分解为红、绿、蓝三个元素。亮度和色度元素被称为YUV(模拟信号)或YCbCr(数字信号)而不是RGB。

一旦被分开,色度分辨率会通过一个叫做“色度取样”的步骤被减半或更多。结果就是在同样的广播带宽情况下,视频信号能呈现更多的细节,这是因为亮度元素对视频信号的贡献更大。

原始图像

色度取样后

这个技术也是很容易实现的,在解码时也不需要进行太多处理。基于这些原因这个方法在今天仍然被广泛的成功使用。

它是如何工作的

早期的显示器是以逐行扫描每个横线上的像素来显示图像的,通常是从顶部到底部快速连续的扫描。在每条线被扫描时,色度数值的传送频率比亮度低。

尽管现代的显示设备不是这种工作模式,扫描线的概念依然很重要,因为色度取样的方式是水平的。一条线被扫描时传递的亮度值和色度值间的比率常用来描述各种取样方式。这个比率通常基于亮度值,然后以4:X:Y的形式描述,X和Y是每两个色度通道中的数值的相对数量。下面的例子中体现了这些比率是如何影响一个4x2像素图像的分辨率。

亮度分辨率

色度分辨率4:4:4

色度分辨率4:1:1

色度分辨率4:2:0

使用标准的命名规则,4:2:2意味着每个横向的扫描线每4个亮度值对应两个色度值。简单的,4:1:1意味着每4个亮度值对应1个色度值,4:4:4意味着色度值不进行二次采样。不过这不是完全连续的,4:2:0会以1个色度值对应四个亮度值,对于第一个色度元素有两个取样值,第二个色度元素则不进行取样,这不能产生完整的彩色图像。实际当中,4:2:0意味着每条扫描线有两个色度取样,只对隔行进行取样。

压缩失真

由于色度取样有效的减少了色彩分辨率,在色彩过渡较锐利的边缘体现较明显。下面的例子展现了在8x8的图像中压缩后的样子。

原始4:4:4

色度取样4:2:2

色度取样4:1:1

色度取样4:2:0

副作用通常是减少细节处颜色的饱和度。通常这个不会减少大个物体内的颜色饱和度,如果这些物体含有精细的色彩图案,压缩后会较明显。下面的这种色彩图案就很容易受压缩的影响:

原始

4:2:2

4:1:1

4:2:0

总结

尽管从早期视频采样到现在,色度取样已经是一种简单有效的压缩技术,但是它会产生明显的失真。数字技术那是起也变得更复杂。不过取样只是简单的减少图像的色彩分辨率的宽度,现代数字编码能够分析图像内容然后决定如何优先处理细节。举例来说,现代数字采样,能够对低亮度、低饱和度以及细节度低的区域区别对待。

消费者的眼光也变得更犀利,对图像质量的要求也越来越高。对于4:2:0压缩方式的DVD,蓝光碟成为了趋势。最后,在进行现代数字编码时,为其提供4:4:4采样的数据,能极大程度的改善编码后的图像质量。

原文发布于微信公众号 - 瓜大三哥(xiguazai_tortoise)

原文发表时间:2018-06-22

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏量化投资与机器学习

【全网首发】机器学习该如何应用到量化投资系列(二)

有一些单纯搞计算机、数学或者物理的人会问,究竟怎么样应用 ML 在量化投资。他们能做些什么自己擅长的工作。虽然在很多平台或者自媒体有谈及有关的问题,但是不够全面...

2746
来自专栏数据派THU

教你用机器学习匹配导师 !(附代码)

作者:Zipporah Polinsky-Nagel, Gregory Brucchieri, Marissa Joy, William Kye, Nan Li...

1172
来自专栏数据派THU

机器学习算法清单!附Python和R代码

来源:数据与算法之美 通过本文为大家介绍了3种机器学习算法方式以及10种机器学习算法的清单,学起来吧~ 前言 谷歌董事长施密特曾说过:虽然谷歌的无人驾驶汽车和机...

4847
来自专栏Petrichor的专栏

论文阅读: YOLOv2

本文获得了CVPR 2017 Best Paper Honorable Mention:

2824
来自专栏深度学习自然语言处理

【论文笔记】中文词向量论文综述(一)

最近在做中文词向量相关工作,其中看了一些中文词向量的相关论文,在这篇文章,将把近几年的中文词向量进展及其模型结构加以简述,大概要写3-4篇综述,每篇包含2-3篇...

1132
来自专栏PPV课数据科学社区

连载 | 概率论与数理统计(3) – 一维离散型随机变量及其Python实现

上一小节对随机变量做了一个概述,这一节主要记录一维离散型随机变量以及关于它们的一些性质。对于概率论与数理统计方面的计算及可视化,主要的Python包有scipy...

1622
来自专栏大数据挖掘DT机器学习

用R语言建立学生的学习表现和性格特征数据模型

一、项目介绍: 方法包括以下步骤 S1:将个体表现数据输入到数据库; S2:建立学习者的学习表现数据库和性格特征数据库; S3:建立学习者的学习表现数据模型和性...

3416
来自专栏人工智能头条

Yoshua Bengio、 Leon Bottou等大神传授:深度学习的26条经验

2372
来自专栏人工智能LeadAI

基于协同过滤的推荐引擎(理论部分)

记得原来和朋友猜测过网易云的推荐是怎么实现的,大概的猜测有两种:一种是看你听过的和收藏过的音乐,再看和你一样听过这些音乐的人他们喜欢听什么音乐,把他喜欢的你没听...

3345
来自专栏媒矿工厂

HDR关键技术:HEVC/H.265编码方案

前文我们对HEVC的HDR编码优化技术做了介绍,侧重编码性能的提升。本章主要阐述HEVC中HDR/WCG相关的整体编码方案,包括不同应用场景下的HEVC扩展编码...

5750

扫码关注云+社区

领取腾讯云代金券