对比度保留之彩色图像去色算法---基础算法也可以上档次。

    因昨日写的匆忙,有不少错误,特重写并增加了适当的解释,并且觉得对于搞图像处理的朋友来说,这个可能在很多场合还是用得着的,因此删除了原随笔,又重新发布了下,非有意刷屏。

     原来一直认为彩色图像的去色算法没啥研究价值,网络上已经有很多类似的算法了,比如著名的Gray = R*0.299 + G*0.587 + B*0.114公式,或者LAB颜色通道的L值,HSL的L通道等等,直到最近看一些论文,发现原来也有很多人对这个过程进行过详细的研究和创新。在学习这些算法的同时,使我也认识到,任何你认为简单的东西在背后都有可能有着复杂的机理,只是你没有发现而已。

      我先拿两个图片的例子来说明为什么要对彩图去色的过程进行研究,同时也说明了常用的方法存在的一些缺陷。

      下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以及matlab的rgb2gray命令的效果。

上面的效果有什么问题,不错,很多人包括我开始也觉得似乎没啥大毛病,可仔细看看,你就会发现第一幅图中的晚霞以及晚霞在水中的倒影和太阳在去色后已经很难找到其踪影了,而第二副图的红花和绿叶去色后基本变得一致了,这其实即是所谓的对比度丢失,这种丢失对于普通的图像处理用户也许问题不大,不过对于图像分析方面是很不利的。

     针对这个问题,不少作者都提出了解决方案,我这里列出三篇论文供有兴趣的朋友参考:

     (1)Color2Gray: Salience-Preserving Color Removal  ,作者Amy A. Gooch Sven C. Olsen Jack Tumblin Bruce Gooch

     论文中提及的源码下载地址已经无效了,我也不记得我这是从哪里下载到的,但确实是和原文匹配的代码:http://files.cnblogs.com/Imageshop/Color2GrayMatlabCode.rar

     这个代码仅仅具有学习价值,因为作者在论文中说100*100大小的图像算法用时12.7秒,这么长的时间那还搞个屁啊。

     (2)Contrast Preserving Decolorization ,作者 Cewu Lu Li Xu Jiaya Jia

   以及:

     (3)Real-time Contrast Preserving Decolorization,作者 Cewu Lu Li Xu Jiaya Jia

后两篇文章配套的下载地址为:http://appsrv.cse.cuhk.edu.hk/~xuli/mypapers/cpcolor2gray_v2.zip

    后两篇文章都是我们国人的杰作,不过不是大陆的,是香港大学的几位高人的作品,我特别关注的是Jiaya Jia,。

    特别是最后一篇文章的算法,效果好且执行速度快,能满足实时的要求。

    这3篇论文都是以最小化一个能量函数为目标的:

  (1)

     其中gx,gy为灰度化后的像素值。而δx,y则表示颜色对比度,三篇论文中开始的时候都是用的LAB颜色空间的一些相关计算公式。

     在第三篇论文中,作者进一步将目标函数改写为:

  (2)

  式中:Nб是高斯分布函数,△gx,y=gx-gy ;

  然后优化的目标就是求上式的最大值。

     在第三篇论文中提出算法最为实用,他没有像第二篇那样采用了二维的模型,而是简化为一维模型,类似于公式Gray = R*0.299 + G*0.587 + B*0.114,论文中也是使用W1,W2,W3三个系数来控制结果值,但是这三个系数不是固定的,而是同用户输入的图像自适应的。同时有约束条件W1>0;W2>0;W3>0,以及W1+W2+W3=1;满足这几个条件的W1,W2,W3的值的组合还是有无限个的,但是作者注意到系数的微小变化对于输出的结果的影响不是特别大,因此,论文中提出了将每个系数在[0,1]之间量化为10等份,即只取0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8,0.9、1.0这11个值,在满足约束条件的情况下,W1、W2、W2的组合总共只会有11*(11+1)/2 =66 种,如下所示:

W = [    0         0    1.0000
         0    0.1000    0.9000
         0    0.2000    0.8000
         0    0.3000    0.7000
         0    0.4000    0.6000
         0    0.5000    0.5000
         0    0.6000    0.4000
         0    0.7000    0.3000
         0    0.8000    0.2000
         0    0.9000    0.1000
         0    1.0000         0
    0.1000         0    0.9000
    0.1000    0.1000    0.8000
    0.1000    0.2000    0.7000
    0.1000    0.3000    0.6000
    0.1000    0.4000    0.5000
    0.1000    0.5000    0.4000
    0.1000    0.6000    0.3000
    0.1000    0.7000    0.2000
    0.1000    0.8000    0.1000
    0.1000    0.9000         0
    0.2000         0    0.8000
    0.2000    0.1000    0.7000
    0.2000    0.2000    0.6000
    0.2000    0.3000    0.5000
    0.2000    0.4000    0.4000
    0.2000    0.5000    0.3000
    0.2000    0.6000    0.2000
    0.2000    0.7000    0.1000
    0.2000    0.8000         0
    0.3000         0    0.7000
    0.3000    0.1000    0.6000
    0.3000    0.2000    0.5000
    0.3000    0.3000    0.4000
    0.3000    0.4000    0.3000
    0.3000    0.5000    0.2000
    0.3000    0.6000    0.1000
    0.3000    0.7000    0.0000
    0.4000         0    0.6000
    0.4000    0.1000    0.5000
    0.4000    0.2000    0.4000
    0.4000    0.3000    0.3000
    0.4000    0.4000    0.2000
    0.4000    0.5000    0.1000
    0.4000    0.6000    0.0000
    0.5000         0    0.5000
    0.5000    0.1000    0.4000
    0.5000    0.2000    0.3000
    0.5000    0.3000    0.2000
    0.5000    0.4000    0.1000
    0.5000    0.5000         0
    0.6000         0    0.4000
    0.6000    0.1000    0.3000
    0.6000    0.2000    0.2000
    0.6000    0.3000    0.1000
    0.6000    0.4000    0.0000
    0.7000         0    0.3000
    0.7000    0.1000    0.2000
    0.7000    0.2000    0.1000
    0.7000    0.3000    0.0000
    0.8000         0    0.2000
    0.8000    0.1000    0.1000
    0.8000    0.2000    0.0000
    0.9000         0    0.1000
    0.9000    0.1000    0.0000
    1.0000         0         0];

优化的目的就是从输入图像的数据确定最优的权值使得式(2)的值最大。

     考虑到图片内在的颜色的冗余性,为进一步提高速度,论文提出不在原始的图像中搜索最优系数,而是现将图像缩小到一定范围,在缩放后的图中找寻,作者建议缩小到64*64(原图为等宽高的情况)大小,此时即能提高速度,又不会降低精度,但是注意一点就是最好是采用最近邻插值,因为这不会产生新的像素。 

     上面两种优化方式,特别是搜索空间的这种离散化,我想在很多算法中都可以去模仿的。

  贴些和第三篇文章基本对应的matlab代码。

 1 function  img  = rtcprgb2gray(im)
 2  
 3 %%  Proprocessing 
 4 [n,m,ch] = size(im); 
 5 sigma = 0.05;
 6 W = wei();
 7  
 8  
 9 %%  Global and Local Contrast Computing
10 ims = imresize(im, round(64/sqrt(n*m)*[n,m]),'nearest');
11 R = ims(:,:,1);G = ims(:,:,2);B = ims(:,:,3);
12 imV = [R(:),G(:),B(:)];
13 defaultStream = RandStream.getDefaultStream; savedState = defaultStream.State;
14 t1 = randperm(size(imV,1));
15 Pg = [imV - imV(t1,:)];
16 
17 ims = imresize(ims, 0.5 ,'nearest');
18 Rx = ims(:,1:end-1,1) - ims(:,2:end,1);
19 Gx = ims(:,1:end-1,2) - ims(:,2:end,2);
20 Bx = ims(:,1:end-1,3) - ims(:,2:end,3);
21 
22 Ry = ims(1:end-1,:,1) - ims(2:end,:,1);
23 Gy = ims(1:end-1,:,2) - ims(2:end,:,2);
24 By = ims(1:end-1,:,3) - ims(2:end,:,3);
25 Pl = [[Rx(:),Gx(:),Bx(:)];[Ry(:),Gy(:),By(:)]];
26 
27 P = [Pg;Pl ]; 
28  
29 det = sqrt(sum(P.^2,2))/1.41  ;
30  
31 P( (det < 0.05),:) = []; det( (det < 0.05)) = [];
32 detM =  repmat(det,[1,size(W,1)]); L = P*W'; 
33  
34 %% Energy optimization
35  
36 U = log(exp(- (L + detM ).^2/sigma.^2) + exp(- (L- detM).^2/sigma.^2));
37 Es = mean(U); 
38  
39   
40  
41 %% Output
42 [NULLval,bw] = max(Es); 
43 img = imlincomb(W(bw,1),im(:,:,1) , W(bw,2),im(:,:,2) ,  W(bw,3),im(:,:,3));
44  
45 end

  第10行即为减少搜索样本。第14行产生不重复的随即对,第27行以及下面计算det的代码未和原文对应,不过似乎不影响结果,第36行计算能量,然后取能量最大的哪个作为权值。

     上述代码中PL值其实即计算水平和垂直方向的梯度值,而再次使用ims = imresize(ims, 0.5 ,'nearest');这样的语句也是为了加快计算速度,对为什么用这样的计算方法,原始论文也没有提及,编码的时候似乎去掉这个pl效果也没啥区别。

     上述代码如果要在项目中使用,还必须转换为其他的语种,转换应该不存在困难的地方,基本就是一些矩阵或者说数组的操作,唯一比较困难的就是randperm函数,他产生一定范围内的不重复的随机数,这个可以参考http://blog.csdn.net/devfun/article/details/6534476一文,抑或是复制下面的代码:

private static int[] RandPerm(int N)
{
    //http://blog.csdn.net/devfun/article/details/6534476
    int X;
    Random Rnd = new Random(Environment.TickCount);
    int[] TempArray = new int[N];
    int[] Value = new int[N];
    for (X = 0; X < N; X++) TempArray[X] = X;
    for (X = 0; X < N; X++)
    {
        int Seed = Rnd.Next(0, N - X);           //从剩下的随机数里生成     
         Value[X] = TempArray[Seed];                 //赋值给结果数组     
         TempArray[Seed] = TempArray[N - X - 1];   //把随机数产生过的位置替换为未被选中的值。     
    }
    return Value;
}

     至于算法的更加原理性的东西,只能看论文本身了吧,实用为王,对于那些提供了参考代码的论文,基本知道原理的意思,然后关键就是掌握代码的改写了。

     至于速度,在我I3的笔记本CPU上,参考上述M代码,用C#编制的程序,对于1024*768的图片耗时约为40ms(未优化代码,优化应该能达到20ms)。

     而算法效果,我们可以通过以下十几副图像的比较得出结论。

     下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以论文3的结果。

         原图|PS的彩色转灰度|PS的去色命令|论文3的结果

  由以上举的一些例子,可以明显的看出论文中的效果要很多,有些图PS转换为灰度后丢失了太多的信息了就变得毫无意义了。

    在计算机识别领域,有很多算法需要将彩色先转换为灰度,我想这个时候上述论文中的这种转换效果就非常有意义了。

    提供一个C#的测试程序:http://files.cnblogs.com/Imageshop/Decolorization.rar

    关于去色,仔细找找,其实还有很多其他的比较成功和优秀的算法,因此,不要小看一些基础的算法,只要你仔细研究,总会有新发现。

*********************************作者: laviewpbt   时间: 2013.11.19   联系QQ:  33184777  转载请保留本行信息************************

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习之旅

python开发:特征工程代码模版(二)

正题开始: 这篇文章是入门级的特征处理的打包解决方案的python实现汇总,如果想get一些新鲜血液的朋友可以叉了,只是方便玩数据的人进行数据特征筛选的代码集...

903
来自专栏Pytorch实践

【NLP】三分钟带你看懂如何做网页搜索

01 — 搜索基本过程 对于网页搜索,传统的过程可以理解为:用户提交POST,搜索引擎返回RESPONSE。最开始的搜索过程,用户基本上是提供关键词,然...

3279
来自专栏大数据钻研

大数据入门之路 献给迷茫的你

假如你想成为一个数据科学家,或者已经是数据科学家的你想扩展你的技能,那么你已经来对地方了。本文的目的就是给数据分析方面的Python新手提供一个完整的学习路径。...

3084
来自专栏大数据文摘

数据挖掘比赛通用框架

1968
来自专栏悦思悦读

自己动手制作“平均脸”【2】

在本系列的上一篇中,我们讲解了用Image morphing方法合成人脸图片的基本原理。 所有代码都在:https://github.com/juliali/A...

3629
来自专栏机器学习算法与Python学习

推荐 | Python机器学习项目实战(附代码 + 可下载)【一】

Putting the machine learning pieces together

1063
来自专栏专知

【干货】Python机器学习项目实战1(附代码)

7932
来自专栏数据科学与人工智能

【陆勤践行】数据科学的完整学习路径—Python版

从Python菜鸟到Python Kaggler的旅程(译注:Kaggle是一个数据建模和数据分析竞赛平台) 假如你想成为一个数据科学家,或者已经是数据科学家的...

1849
来自专栏编程

Python数据挖掘学习路线是什么?学习Python学什么?

学习Python数据挖掘,你有明确的路线吗,学任何东西首先你要知道学习它的路线,了解了路线才能更容易学习,学习起来才不会非常费劲,进入正题,看看千锋教育的Pyt...

20110
来自专栏新智元

【李飞飞团队最新研究】神经任务编程NTP,具有强大泛化能力的机器人学习框架

【新智元导读】斯坦福大学计算机视觉实验室李飞飞团队的最新研究提出一个新的机器人学习框架:神经任务编程(NTP),在机械臂的物品堆叠、分拣和桌面清理三类任务中,证...

3548

扫码关注云+社区