对比度保留之彩色图像去色算法---基础算法也可以上档次。

    因昨日写的匆忙,有不少错误,特重写并增加了适当的解释,并且觉得对于搞图像处理的朋友来说,这个可能在很多场合还是用得着的,因此删除了原随笔,又重新发布了下,非有意刷屏。

     原来一直认为彩色图像的去色算法没啥研究价值,网络上已经有很多类似的算法了,比如著名的Gray = R*0.299 + G*0.587 + B*0.114公式,或者LAB颜色通道的L值,HSL的L通道等等,直到最近看一些论文,发现原来也有很多人对这个过程进行过详细的研究和创新。在学习这些算法的同时,使我也认识到,任何你认为简单的东西在背后都有可能有着复杂的机理,只是你没有发现而已。

      我先拿两个图片的例子来说明为什么要对彩图去色的过程进行研究,同时也说明了常用的方法存在的一些缺陷。

      下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以及matlab的rgb2gray命令的效果。

上面的效果有什么问题,不错,很多人包括我开始也觉得似乎没啥大毛病,可仔细看看,你就会发现第一幅图中的晚霞以及晚霞在水中的倒影和太阳在去色后已经很难找到其踪影了,而第二副图的红花和绿叶去色后基本变得一致了,这其实即是所谓的对比度丢失,这种丢失对于普通的图像处理用户也许问题不大,不过对于图像分析方面是很不利的。

     针对这个问题,不少作者都提出了解决方案,我这里列出三篇论文供有兴趣的朋友参考:

     (1)Color2Gray: Salience-Preserving Color Removal  ,作者Amy A. Gooch Sven C. Olsen Jack Tumblin Bruce Gooch

     论文中提及的源码下载地址已经无效了,我也不记得我这是从哪里下载到的,但确实是和原文匹配的代码:http://files.cnblogs.com/Imageshop/Color2GrayMatlabCode.rar

     这个代码仅仅具有学习价值,因为作者在论文中说100*100大小的图像算法用时12.7秒,这么长的时间那还搞个屁啊。

     (2)Contrast Preserving Decolorization ,作者 Cewu Lu Li Xu Jiaya Jia

   以及:

     (3)Real-time Contrast Preserving Decolorization,作者 Cewu Lu Li Xu Jiaya Jia

后两篇文章配套的下载地址为:http://appsrv.cse.cuhk.edu.hk/~xuli/mypapers/cpcolor2gray_v2.zip

    后两篇文章都是我们国人的杰作,不过不是大陆的,是香港大学的几位高人的作品,我特别关注的是Jiaya Jia,。

    特别是最后一篇文章的算法,效果好且执行速度快,能满足实时的要求。

    这3篇论文都是以最小化一个能量函数为目标的:

  (1)

     其中gx,gy为灰度化后的像素值。而δx,y则表示颜色对比度,三篇论文中开始的时候都是用的LAB颜色空间的一些相关计算公式。

     在第三篇论文中,作者进一步将目标函数改写为:

  (2)

  式中:Nб是高斯分布函数,△gx,y=gx-gy ;

  然后优化的目标就是求上式的最大值。

     在第三篇论文中提出算法最为实用,他没有像第二篇那样采用了二维的模型,而是简化为一维模型,类似于公式Gray = R*0.299 + G*0.587 + B*0.114,论文中也是使用W1,W2,W3三个系数来控制结果值,但是这三个系数不是固定的,而是同用户输入的图像自适应的。同时有约束条件W1>0;W2>0;W3>0,以及W1+W2+W3=1;满足这几个条件的W1,W2,W3的值的组合还是有无限个的,但是作者注意到系数的微小变化对于输出的结果的影响不是特别大,因此,论文中提出了将每个系数在[0,1]之间量化为10等份,即只取0、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8,0.9、1.0这11个值,在满足约束条件的情况下,W1、W2、W2的组合总共只会有11*(11+1)/2 =66 种,如下所示:

W = [    0         0    1.0000
         0    0.1000    0.9000
         0    0.2000    0.8000
         0    0.3000    0.7000
         0    0.4000    0.6000
         0    0.5000    0.5000
         0    0.6000    0.4000
         0    0.7000    0.3000
         0    0.8000    0.2000
         0    0.9000    0.1000
         0    1.0000         0
    0.1000         0    0.9000
    0.1000    0.1000    0.8000
    0.1000    0.2000    0.7000
    0.1000    0.3000    0.6000
    0.1000    0.4000    0.5000
    0.1000    0.5000    0.4000
    0.1000    0.6000    0.3000
    0.1000    0.7000    0.2000
    0.1000    0.8000    0.1000
    0.1000    0.9000         0
    0.2000         0    0.8000
    0.2000    0.1000    0.7000
    0.2000    0.2000    0.6000
    0.2000    0.3000    0.5000
    0.2000    0.4000    0.4000
    0.2000    0.5000    0.3000
    0.2000    0.6000    0.2000
    0.2000    0.7000    0.1000
    0.2000    0.8000         0
    0.3000         0    0.7000
    0.3000    0.1000    0.6000
    0.3000    0.2000    0.5000
    0.3000    0.3000    0.4000
    0.3000    0.4000    0.3000
    0.3000    0.5000    0.2000
    0.3000    0.6000    0.1000
    0.3000    0.7000    0.0000
    0.4000         0    0.6000
    0.4000    0.1000    0.5000
    0.4000    0.2000    0.4000
    0.4000    0.3000    0.3000
    0.4000    0.4000    0.2000
    0.4000    0.5000    0.1000
    0.4000    0.6000    0.0000
    0.5000         0    0.5000
    0.5000    0.1000    0.4000
    0.5000    0.2000    0.3000
    0.5000    0.3000    0.2000
    0.5000    0.4000    0.1000
    0.5000    0.5000         0
    0.6000         0    0.4000
    0.6000    0.1000    0.3000
    0.6000    0.2000    0.2000
    0.6000    0.3000    0.1000
    0.6000    0.4000    0.0000
    0.7000         0    0.3000
    0.7000    0.1000    0.2000
    0.7000    0.2000    0.1000
    0.7000    0.3000    0.0000
    0.8000         0    0.2000
    0.8000    0.1000    0.1000
    0.8000    0.2000    0.0000
    0.9000         0    0.1000
    0.9000    0.1000    0.0000
    1.0000         0         0];

优化的目的就是从输入图像的数据确定最优的权值使得式(2)的值最大。

     考虑到图片内在的颜色的冗余性,为进一步提高速度,论文提出不在原始的图像中搜索最优系数,而是现将图像缩小到一定范围,在缩放后的图中找寻,作者建议缩小到64*64(原图为等宽高的情况)大小,此时即能提高速度,又不会降低精度,但是注意一点就是最好是采用最近邻插值,因为这不会产生新的像素。 

     上面两种优化方式,特别是搜索空间的这种离散化,我想在很多算法中都可以去模仿的。

  贴些和第三篇文章基本对应的matlab代码。

 1 function  img  = rtcprgb2gray(im)
 2  
 3 %%  Proprocessing 
 4 [n,m,ch] = size(im); 
 5 sigma = 0.05;
 6 W = wei();
 7  
 8  
 9 %%  Global and Local Contrast Computing
10 ims = imresize(im, round(64/sqrt(n*m)*[n,m]),'nearest');
11 R = ims(:,:,1);G = ims(:,:,2);B = ims(:,:,3);
12 imV = [R(:),G(:),B(:)];
13 defaultStream = RandStream.getDefaultStream; savedState = defaultStream.State;
14 t1 = randperm(size(imV,1));
15 Pg = [imV - imV(t1,:)];
16 
17 ims = imresize(ims, 0.5 ,'nearest');
18 Rx = ims(:,1:end-1,1) - ims(:,2:end,1);
19 Gx = ims(:,1:end-1,2) - ims(:,2:end,2);
20 Bx = ims(:,1:end-1,3) - ims(:,2:end,3);
21 
22 Ry = ims(1:end-1,:,1) - ims(2:end,:,1);
23 Gy = ims(1:end-1,:,2) - ims(2:end,:,2);
24 By = ims(1:end-1,:,3) - ims(2:end,:,3);
25 Pl = [[Rx(:),Gx(:),Bx(:)];[Ry(:),Gy(:),By(:)]];
26 
27 P = [Pg;Pl ]; 
28  
29 det = sqrt(sum(P.^2,2))/1.41  ;
30  
31 P( (det < 0.05),:) = []; det( (det < 0.05)) = [];
32 detM =  repmat(det,[1,size(W,1)]); L = P*W'; 
33  
34 %% Energy optimization
35  
36 U = log(exp(- (L + detM ).^2/sigma.^2) + exp(- (L- detM).^2/sigma.^2));
37 Es = mean(U); 
38  
39   
40  
41 %% Output
42 [NULLval,bw] = max(Es); 
43 img = imlincomb(W(bw,1),im(:,:,1) , W(bw,2),im(:,:,2) ,  W(bw,3),im(:,:,3));
44  
45 end

  第10行即为减少搜索样本。第14行产生不重复的随即对,第27行以及下面计算det的代码未和原文对应,不过似乎不影响结果,第36行计算能量,然后取能量最大的哪个作为权值。

     上述代码中PL值其实即计算水平和垂直方向的梯度值,而再次使用ims = imresize(ims, 0.5 ,'nearest');这样的语句也是为了加快计算速度,对为什么用这样的计算方法,原始论文也没有提及,编码的时候似乎去掉这个pl效果也没啥区别。

     上述代码如果要在项目中使用,还必须转换为其他的语种,转换应该不存在困难的地方,基本就是一些矩阵或者说数组的操作,唯一比较困难的就是randperm函数,他产生一定范围内的不重复的随机数,这个可以参考http://blog.csdn.net/devfun/article/details/6534476一文,抑或是复制下面的代码:

private static int[] RandPerm(int N)
{
    //http://blog.csdn.net/devfun/article/details/6534476
    int X;
    Random Rnd = new Random(Environment.TickCount);
    int[] TempArray = new int[N];
    int[] Value = new int[N];
    for (X = 0; X < N; X++) TempArray[X] = X;
    for (X = 0; X < N; X++)
    {
        int Seed = Rnd.Next(0, N - X);           //从剩下的随机数里生成     
         Value[X] = TempArray[Seed];                 //赋值给结果数组     
         TempArray[Seed] = TempArray[N - X - 1];   //把随机数产生过的位置替换为未被选中的值。     
    }
    return Value;
}

     至于算法的更加原理性的东西,只能看论文本身了吧,实用为王,对于那些提供了参考代码的论文,基本知道原理的意思,然后关键就是掌握代码的改写了。

     至于速度,在我I3的笔记本CPU上,参考上述M代码,用C#编制的程序,对于1024*768的图片耗时约为40ms(未优化代码,优化应该能达到20ms)。

     而算法效果,我们可以通过以下十几副图像的比较得出结论。

     下面水平4副图从左至右依次为原图、PS的彩色转灰度命令、PS的去色命令以论文3的结果。

         原图|PS的彩色转灰度|PS的去色命令|论文3的结果

  由以上举的一些例子,可以明显的看出论文中的效果要很多,有些图PS转换为灰度后丢失了太多的信息了就变得毫无意义了。

    在计算机识别领域,有很多算法需要将彩色先转换为灰度,我想这个时候上述论文中的这种转换效果就非常有意义了。

    提供一个C#的测试程序:http://files.cnblogs.com/Imageshop/Decolorization.rar

    关于去色,仔细找找,其实还有很多其他的比较成功和优秀的算法,因此,不要小看一些基础的算法,只要你仔细研究,总会有新发现。

*********************************作者: laviewpbt   时间: 2013.11.19   联系QQ:  33184777  转载请保留本行信息************************

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏https://www.cnblogs.com/L

【TensorFlow篇】--Tensorflow框架可视化之Tensorboard

TensorBoard是tensorFlow中的可视化界面,可以清楚的看到数据的流向以及各种参数的变化,本文基于一个案例讲解TensorBoard的用法。

892
来自专栏程序员的知识天地

前端工程师深度学习,就能在浏览器里玩转深度学习

TensorFlow.js 的发布可以说是 JS 社区开发者的福音!但是在浏览器中训练一些模型还是会存在一些问题与不同,如何可以让训练效果更好?本文为大家总结了...

1013
来自专栏AI研习社

神经网络图灵机:深度学习中与内存进行交互的基本方法

内存是大脑和计算机的主要部件。在很多深度学习领域,我们通过和记忆匹配来扩展深度网络的能力,例如,提问与回答,我们先记忆或存储事先处理的信息,然后使用这些信息回答...

682
来自专栏贾志刚-OpenCV学堂

OpenCV基于残差网络实现人脸检测

OpenCV基于残差网络实现人脸检测 OpenCV3.3版本第一次把深度神经网络(DNN)模块引入到正式发布版本中,最新的OpenCV3.4中DNN模块发布了两...

4178
来自专栏AI科技大本营的专栏

你应该知道的神经网络调试技巧

作者 | Russell Stewart 译者 | zhwhong(@zhwhong_shsf) 整理 | AI100(rgznai100) 以下建议主要针对...

2547
来自专栏机器学习算法全栈工程师

15分钟入门NLP神器—Gensim

作为自然语言处理爱好者,大家都应该听说过或使用过大名鼎鼎的Gensim吧,这是一款具备多种功能的神器。 Gensim是一款开源的第三方Python工具包,用于...

1195
来自专栏机器之心

资源 | 可视化工具Yellowbrick:超参与行为的可视化带来更优秀的实现

1383
来自专栏技术翻译

Scikit-Learn: 机器学习的灵丹妙药

Scikit-Learn是python的核心机器学习包,它拥有支持基本机器学习项目所需的大部分模块。该库为从业者提供了一个统一的API(ApplicationP...

1051
来自专栏奇点大数据

Pytorch神器(9)

大家好,今天我们来看Pytorch神器第九次分享的内容——Image Caption。

1282
来自专栏机器学习算法与Python学习

GitHub最受欢迎深度学习应用项目 Top 5

1 Neural Style Star:12122 Github:https://github.com/jcjohnson/neural-style 这个项目是...

41412

扫码关注云+社区