对比度保留之彩色图像去色算法---基础算法也可以上档次。

    因昨日写的匆忙,有不少错误,特重写并增加了适当的解释,并且觉得对于搞图像处理的朋友来说,这个可能在很多场合还是用得着的,因此删除了原随笔,又重新发布了下,非有意刷屏。

     原来一直认为彩色图像的去色算法没啥研究价值,网络上已经有很多类似的算法了,比如著名的Gray = R*0.299 + G*0.587 + B*0.114公式,或者LAB颜色通道的L值,HSL的L通道等等,直到最近看一些论文,发现原来也有很多人对这个过程进行过详细的研究和创新。在学习这些算法的同时,使我也认识到,任何你认为简单的东西在背后都有可能有着复杂的机理,只是你没有发现而已。

      我先拿两个图片的例子来说明为什么要对彩图去色的过程进行研究,同时也说明了常用的方法存在的一些缺陷。

      下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以及matlab的rgb2gray命令的效果。

上面的效果有什么问题,不错,很多人包括我开始也觉得似乎没啥大毛病,可仔细看看,你就会发现第一幅图中的晚霞以及晚霞在水中的倒影和太阳在去色后已经很难找到其踪影了,而第二副图的红花和绿叶去色后基本变得一致了,这其实即是所谓的对比度丢失,这种丢失对于普通的图像处理用户也许问题不大,不过对于图像分析方面是很不利的。

     针对这个问题,不少作者都提出了解决方案,我这里列出三篇论文供有兴趣的朋友参考:

     (1)Color2Gray: Salience-Preserving Color Removal  ,作者Amy A. Gooch Sven C. Olsen Jack Tumblin Bruce Gooch

     论文中提及的源码下载地址已经无效了,我也不记得我这是从哪里下载到的,但确实是和原文匹配的代码:http://files.cnblogs.com/Imageshop/Color2GrayMatlabCode.rar

     这个代码仅仅具有学习价值,因为作者在论文中说100*100大小的图像算法用时12.7秒,这么长的时间那还搞个屁啊。

     (2)Contrast Preserving Decolorization ,作者 Cewu Lu Li Xu Jiaya Jia

   以及:

     (3)Real-time Contrast Preserving Decolorization,作者 Cewu Lu Li Xu Jiaya Jia

后两篇文章配套的下载地址为:http://appsrv.cse.cuhk.edu.hk/~xuli/mypapers/cpcolor2gray_v2.zip

    后两篇文章都是我们国人的杰作,不过不是大陆的,是香港大学的几位高人的作品,我特别关注的是Jiaya Jia,。

    特别是最后一篇文章的算法,效果好且执行速度快,能满足实时的要求。

    这3篇论文都是以最小化一个能量函数为目标的:

  (1)

     其中gx,gy为灰度化后的像素值。而δx,y则表示颜色对比度,三篇论文中开始的时候都是用的LAB颜色空间的一些相关计算公式。

     在第三篇论文中,作者进一步将目标函数改写为:

  (2)

  式中:Nб是高斯分布函数,△gx,y=gx-gy ;

  然后优化的目标就是求上式的最大值。

     在第三篇论文中提出算法最为实用,他没有像第二篇那样采用了二维的模型,而是简化为一维模型,类似于公式Gray = R*0.299 + G*0.587 + B*0.114,论文中也是使用W1,W2,W3三个系数来控制结果值,但是这三个系数不是固定的,而是同用户输入的图像自适应的。同时有约束条件W1>0;W2>0;W3>0,以及W1+W2+W3=1;满足这几个条件的W1,W2,W3的值的组合还是有无限个的,但是作者注意到系数的微小变化对于输出的结果的影响不是特别大,因此,论文中提出了将每个系数在[0,1]之间量化为10等份,即只取0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8,0.9、1.0这11个值,在满足约束条件的情况下,W1、W2、W2的组合总共只会有11*(11+1)/2 =66 种,如下所示:

W = [    0         0    1.0000
         0    0.1000    0.9000
         0    0.2000    0.8000
         0    0.3000    0.7000
         0    0.4000    0.6000
         0    0.5000    0.5000
         0    0.6000    0.4000
         0    0.7000    0.3000
         0    0.8000    0.2000
         0    0.9000    0.1000
         0    1.0000         0
    0.1000         0    0.9000
    0.1000    0.1000    0.8000
    0.1000    0.2000    0.7000
    0.1000    0.3000    0.6000
    0.1000    0.4000    0.5000
    0.1000    0.5000    0.4000
    0.1000    0.6000    0.3000
    0.1000    0.7000    0.2000
    0.1000    0.8000    0.1000
    0.1000    0.9000         0
    0.2000         0    0.8000
    0.2000    0.1000    0.7000
    0.2000    0.2000    0.6000
    0.2000    0.3000    0.5000
    0.2000    0.4000    0.4000
    0.2000    0.5000    0.3000
    0.2000    0.6000    0.2000
    0.2000    0.7000    0.1000
    0.2000    0.8000         0
    0.3000         0    0.7000
    0.3000    0.1000    0.6000
    0.3000    0.2000    0.5000
    0.3000    0.3000    0.4000
    0.3000    0.4000    0.3000
    0.3000    0.5000    0.2000
    0.3000    0.6000    0.1000
    0.3000    0.7000    0.0000
    0.4000         0    0.6000
    0.4000    0.1000    0.5000
    0.4000    0.2000    0.4000
    0.4000    0.3000    0.3000
    0.4000    0.4000    0.2000
    0.4000    0.5000    0.1000
    0.4000    0.6000    0.0000
    0.5000         0    0.5000
    0.5000    0.1000    0.4000
    0.5000    0.2000    0.3000
    0.5000    0.3000    0.2000
    0.5000    0.4000    0.1000
    0.5000    0.5000         0
    0.6000         0    0.4000
    0.6000    0.1000    0.3000
    0.6000    0.2000    0.2000
    0.6000    0.3000    0.1000
    0.6000    0.4000    0.0000
    0.7000         0    0.3000
    0.7000    0.1000    0.2000
    0.7000    0.2000    0.1000
    0.7000    0.3000    0.0000
    0.8000         0    0.2000
    0.8000    0.1000    0.1000
    0.8000    0.2000    0.0000
    0.9000         0    0.1000
    0.9000    0.1000    0.0000
    1.0000         0         0];

优化的目的就是从输入图像的数据确定最优的权值使得式(2)的值最大。

     考虑到图片内在的颜色的冗余性,为进一步提高速度,论文提出不在原始的图像中搜索最优系数,而是现将图像缩小到一定范围,在缩放后的图中找寻,作者建议缩小到64*64(原图为等宽高的情况)大小,此时即能提高速度,又不会降低精度,但是注意一点就是最好是采用最近邻插值,因为这不会产生新的像素。 

     上面两种优化方式,特别是搜索空间的这种离散化,我想在很多算法中都可以去模仿的。

  贴些和第三篇文章基本对应的matlab代码。

 1 function  img  = rtcprgb2gray(im)
 2  
 3 %%  Proprocessing 
 4 [n,m,ch] = size(im); 
 5 sigma = 0.05;
 6 W = wei();
 7  
 8  
 9 %%  Global and Local Contrast Computing
10 ims = imresize(im, round(64/sqrt(n*m)*[n,m]),'nearest');
11 R = ims(:,:,1);G = ims(:,:,2);B = ims(:,:,3);
12 imV = [R(:),G(:),B(:)];
13 defaultStream = RandStream.getDefaultStream; savedState = defaultStream.State;
14 t1 = randperm(size(imV,1));
15 Pg = [imV - imV(t1,:)];
16 
17 ims = imresize(ims, 0.5 ,'nearest');
18 Rx = ims(:,1:end-1,1) - ims(:,2:end,1);
19 Gx = ims(:,1:end-1,2) - ims(:,2:end,2);
20 Bx = ims(:,1:end-1,3) - ims(:,2:end,3);
21 
22 Ry = ims(1:end-1,:,1) - ims(2:end,:,1);
23 Gy = ims(1:end-1,:,2) - ims(2:end,:,2);
24 By = ims(1:end-1,:,3) - ims(2:end,:,3);
25 Pl = [[Rx(:),Gx(:),Bx(:)];[Ry(:),Gy(:),By(:)]];
26 
27 P = [Pg;Pl ]; 
28  
29 det = sqrt(sum(P.^2,2))/1.41  ;
30  
31 P( (det < 0.05),:) = []; det( (det < 0.05)) = [];
32 detM =  repmat(det,[1,size(W,1)]); L = P*W'; 
33  
34 %% Energy optimization
35  
36 U = log(exp(- (L + detM ).^2/sigma.^2) + exp(- (L- detM).^2/sigma.^2));
37 Es = mean(U); 
38  
39   
40  
41 %% Output
42 [NULLval,bw] = max(Es); 
43 img = imlincomb(W(bw,1),im(:,:,1) , W(bw,2),im(:,:,2) ,  W(bw,3),im(:,:,3));
44  
45 end

  第10行即为减少搜索样本。第14行产生不重复的随即对,第27行以及下面计算det的代码未和原文对应,不过似乎不影响结果,第36行计算能量,然后取能量最大的哪个作为权值。

     上述代码中PL值其实即计算水平和垂直方向的梯度值,而再次使用ims = imresize(ims, 0.5 ,'nearest');这样的语句也是为了加快计算速度,对为什么用这样的计算方法,原始论文也没有提及,编码的时候似乎去掉这个pl效果也没啥区别。

     上述代码如果要在项目中使用,还必须转换为其他的语种,转换应该不存在困难的地方,基本就是一些矩阵或者说数组的操作,唯一比较困难的就是randperm函数,他产生一定范围内的不重复的随机数,这个可以参考http://blog.csdn.net/devfun/article/details/6534476一文,抑或是复制下面的代码:

private static int[] RandPerm(int N)
{
    //http://blog.csdn.net/devfun/article/details/6534476
    int X;
    Random Rnd = new Random(Environment.TickCount);
    int[] TempArray = new int[N];
    int[] Value = new int[N];
    for (X = 0; X < N; X++) TempArray[X] = X;
    for (X = 0; X < N; X++)
    {
        int Seed = Rnd.Next(0, N - X);           //从剩下的随机数里生成     
         Value[X] = TempArray[Seed];                 //赋值给结果数组     
         TempArray[Seed] = TempArray[N - X - 1];   //把随机数产生过的位置替换为未被选中的值。     
    }
    return Value;
}

     至于算法的更加原理性的东西,只能看论文本身了吧,实用为王,对于那些提供了参考代码的论文,基本知道原理的意思,然后关键就是掌握代码的改写了。

     至于速度,在我I3的笔记本CPU上,参考上述M代码,用C#编制的程序,对于1024*768的图片耗时约为40ms(未优化代码,优化应该能达到20ms)。

     而算法效果,我们可以通过以下十几副图像的比较得出结论。

     下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以论文3的结果。

         原图|PS的彩色转灰度|PS的去色命令|论文3的结果

  由以上举的一些例子,可以明显的看出论文中的效果要很多,有些图PS转换为灰度后丢失了太多的信息了就变得毫无意义了。

    在计算机识别领域,有很多算法需要将彩色先转换为灰度,我想这个时候上述论文中的这种转换效果就非常有意义了。

    提供一个C#的测试程序:http://files.cnblogs.com/Imageshop/Decolorization.rar

    关于去色,仔细找找,其实还有很多其他的比较成功和优秀的算法,因此,不要小看一些基础的算法,只要你仔细研究,总会有新发现。

*********************************作者: laviewpbt   时间: 2013.11.19   联系QQ:  33184777  转载请保留本行信息************************

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏Petrichor的专栏

论文阅读: Light-head R-CNN

“ Head ” 在文中指连接在basemodel后面的网络结构,包括以下两部分:

1184
来自专栏小小挖掘机

windows下使用word2vec训练维基百科中文语料全攻略!(三)

训练一个聊天机器人的很重要的一步是词向量训练,无论是生成式聊天机器人还是检索式聊天机器人,都需要将文字转化为词向量,时下最火的词向量训练模型是word2vec,...

3505
来自专栏机器学习算法与Python学习

GitHub最受欢迎深度学习应用项目 Top 5

1 Neural Style Star:12122 Github:https://github.com/jcjohnson/neural-style 这个项目是...

43212
来自专栏有趣的Python和你

sklearn调包侠之KNN算法

1595
来自专栏大数据挖掘DT机器学习

写一只具有识别能力的图片爬虫

在网上看到python做图像识别的相关文章后,真心感觉python的功能实在太强大,因此将这些文章总结一下,建立一下自己的知识体系。 当然了,图像识别这个话题...

4105
来自专栏计算机视觉战队

简单易懂的讲解深度学习(入门系列之八)

神经网络也许是计算机计算的将来,一个了解它的好方法是用一个它可以解决的难题来说明。假设给出 500 个字符的代码段,您知道它们是C,C++,JAVA或Pytho...

663
来自专栏小鹏的专栏

机器学习进阶系列

本文为博主原创文章,未经博主允许不得转载。有问题可以加微信:lp9628(注明CSDN)。

2837
来自专栏计算机视觉战队

神经网络介绍—利用反向传播算法的模式学习

神经网络也许是计算机计算的将来,一个了解它的好方法是用一个它可以解决的难题来说明。假设给出 500 个字符的代码段,您知道它们是C,C++,JAVA或Pytho...

2658
来自专栏机器之心

听说你用JavaScript写代码?本文是你的机器学习指南

3776
来自专栏AI科技评论

开发 | 机器学习之确定最佳聚类数目的10种方法

AI科技评论按,本文作者贝尔塔,原文载于知乎专栏数据分析与可视化,AI科技评论获其授权发布。 在聚类分析的时候确定最佳聚类数目是一个很重要的问题,比如kmean...

34812

扫码关注云+社区