前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >颜色空间系列1: RGB和CIEXYZ颜色空间的转换及相关优化

颜色空间系列1: RGB和CIEXYZ颜色空间的转换及相关优化

作者头像
用户1138785
发布2019-09-11 17:11:12
3K0
发布2019-09-11 17:11:12
举报

颜色空间系列代码下载链接:http://files.cnblogs.com/Imageshop/ImageInfo.rar (同文章同步更新)

在颜色感知的研究中,CIE 1931 XYZ 色彩空间(也叫做 CIE 1931 色彩空间)是其中一个最先采用数学方式来定义的色彩空间,它由国际照明委员会(CIE)于1931年创立。CIE XYZ 色彩空间是从 1920 年代后期 W. David Wright (Wright 1928) 和 John Guild (Guild 1931) 做的一系列实验中得出的。他们的实验结果合并到了 CIE RGB 色彩空间的规定中,CIE XYZ 色彩空间再从它得出。

更过具体的关于XYZ空间的理论解释可见:点击打开链接

本文的重点是如何优化这个RGB<->XYZ相互转换的过程。

从相关的文献包括OpenCv的文档中可找到两者的理论转换算式如下:

[X] [0.412453 0.357580 0.180423] [R]

[Y] = [0.212671 0.715160 0.072169] [G] (1)

[Z] [0.019334 0.119193 0.950227] [B]

[R] [3.240479 -1.537150 -0.498535] [X]

[G] = [-0.969256 1.875992 0.041556] [Y] (2)

[B] [0.055648 -0.204043 1.057311] [Z]

仔细观察式(1),其中 X = 0.412453 * R + 0.412453 *G+ 0.412453B ; 各系数相加之和为0.950456,非常接近于1,我们知道R/G/B的取值范围为[ 0,255 ],如果系数和等于1,则X的取值范围也必然在[ 0,255 ]之间,因此我们可以考虑等比修改各系数,使其之和等于1,这样就做到了XYZ和RGB在同等范围的映射,因此第一行的系数应分别修改为 [0.412453 0.357580 0.180423] / [0.950456] = [0.433953 0.376219 0.189828]。

式(1)的第二行,三个系数之和恰为1,因此无需修正。

式(1)的第三行,三个系数之和为1.088754,修正算式为 [0.019334 0.119193 0.950227] / [1.088754] = [0.017758 0.109477 0.872765]

由于式(1)的变化,式(2)必须做相应的调整,考虑式(1)关于X的各分量都除以了 0.950456,因此,只需在式2的对应分量上乘以 0.950456即可,同理,关于Z的各分量由于都除以了1.088754,式(2)各分量必须对应乘以1.088754。得到最终的变换式(3)(4)。

[X] [0.433953 0.376219 0.189828] [R]

[Y] = [0.212671 0.715160 0.072169] [G] (3)

[Z] [0.017758 0.109477 0.872765] [B]

[R] [3.0799327 -1.537150 -0.542782] [X]

[G] = [-0.921235 1.875992 0.0452442] [Y] (4)

[B] [0.0528909 -0.204043 1.1511515] [Z]

如果有朋友查阅过OpenCv的RGB到LAB空间的转换,就可以发现Cv就是用的上述矩阵先将RGB转到XYZ,再由XYZ转为LAB的。

由以上数式可以看出RGB和XYZ颜色空间的转换时线性的,因此,两个系数矩阵之间的成绩必为一个E矩阵(对角线为1,其他元素都为0),读者可以用matlab测试下。

由于各小数的存在,理论上说,RGB颜色空间的颜色对应的XYZ分量的数值一般都为浮点数,之前说过经过调整系数矩阵后其有效范围在[0,255]之间,这和RGB的范围是一致的,因此我们更感兴趣的可能是用整数表示XYZ的值,此时,如果先用上述计算式计算,最后在用(int) 强制取整,则效率很低下,因此,很有必要做点的优化。

优化的原理基本就是用整数的乘除法来替代浮点运算,比如,对各系数乘以一个很大的数,计算出结果在整除这个数,则得到的数字和之前的浮点算式取整结果是一致的。

如何取放大系数,也有着一定的讲究,比如0.433953 ,很多朋友的第一反应应该是乘以1000000得到433953 ,不错,这是个很好的优化,却不是最好的,因为最后的整除1000000相对来说也是个慢的过程,如果我们能够整除一个2的N次幂数,则可以用整数的移位来代替整除。众所周知,移位的速度非常快。

那这个N如何取呢,比方说取1可行吗,分析下马上得到的结果是绝对不行,因为很多系数乘以2再取整就变为0了。我对这个N的取值建议是在保证整个算式的每个部分的计算结果不超过int(对于64位CPU,则是long类型)类型的最大范围时,N越大越好。像我们这种情况,由于RGB的取值范围是[255],因此N的取值最大只能是23。

假定我们取N的值为20,则RGB转XYZ的算式可以写为如下:

代码语言:javascript
复制
X = (Blue * 199049 + Green * 394494 + Red * 455033 + 524288) >> 20;          // 这些系数是按照RGBLAB类里的labXr_32f放大2^20后得到的  
Y = (Blue * 75675 + Green * 749900 + Red * 223002 + 524288) >> 20;  
Z = (Blue * 915161 + Green * 114795 + Red * 18621 + 524288) >> 20;            //  这里无需验证结果是否在[0,255]之间,必然在。     

注意算式中的524288,这个值等于(2^20)/2,加上他的作用是使整个算式能够做到四舍五入。

另外,还要注意各系数小数点后数字的累积,那X一行来说事,0.433953 * 2^20 = 455032.700928,我们取值455033 ,0.376219 * 2^20= 394494.214144 ,则取值394494 ,那么最后一个系数其实可以不用计算,直接拿 2^20-455033 -394494 =199049 。

对应的XYZ转RGB空间算式为:

代码语言:javascript
复制
Blue = (X * 55460 - Y * 213955 + Z * 1207070) >> 20;  
Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;    // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
Red = (X * 3229543 - Y * 1611819 - Z * 569148) >> 20;  
if (Red > 255) Red = 255; else if (Red < 0) Red = 0;      // 这里需要判断,因为RGB空间所有的颜色转换到XYZ后,并不是填充满了0-255的范围的,反转过去就会存在一些溢出的点。
if (Green > 255) Green = 255; else if (Green < 0) Green = 0;  // 编译后比三目运算符的效率高  
if (Blue > 255) Blue = 255; else if (Blue < 0) Blue = 0;  

正如代码中的注释一样,XYZ-RGB的转换必须判断转换的颜色是否在有效范围内。

另外对上述算式提一点点优化方面的是事情:

代码语言:javascript
复制
Green = (X * -965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
00000048  imul        ebx,edi,0FFF1429Fh   
0000004e  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000055  add         ebx,eax   
00000057  imul        eax,dword ptr [ebp-14h],0B952h   
0000005e  add         ebx,eax   
00000060  sar         ebx,14h   

另外一种写法:

代码语言:javascript
复制
Green = (-X * 965985 + Y * 1967119 + Z * 47442) >> 20;       // x * -965985 和 -x * 965985 在反汇编后是不一样的,后者多了个neg指令  
00000048  mov         ebx,edi   
0000004a  neg         ebx   
0000004c  imul        ebx,ebx,0EBD61h   
00000052  imul        eax,dword ptr [ebp-10h],1E040Fh   
00000059  add         ebx,eax   
0000005b  imul        eax,dword ptr [ebp-14h],0B952h   
00000062  add         ebx,eax   
00000064  sar         ebx,14h   

可以看到多了一句neg语句,虽然这个语句基本对效率没啥影响,但是作为一个速度控,我对这些还是很感兴趣的。

下面给出一些转换后的视觉图:

原始图像:

XYZ综合图像:

X通道图像:

Y通道图像:

Z通道图像:

最后说一句,由于上述取整操作的执行,实际上是执行了一个有损的过程,因此,即使不做任何对XYZ的改变,对一副图片进行多次转换,就可以看出图像慢慢的变得不同了, 如下图所示为转换10次左后的结果:

  可以看到脸部有明显的斑纹,因此,如果要进行高精度的计算,那还是请按照公式(3)(4)一步一步来吧。

'*********************************************************************

  转载请保留以下信息:

  作者: laviewpbt

  时间:2013.1.31 7点于办公室

  QQ:33184777

  E-Mail : laviewpbt@sina.com

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2013-01-31 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档