破解PRISMA（中）

刀刀老高

发布于 2018-04-10 18:09:20

1.1K0

发布于 2018-04-10 18:09:20

文章被收录于专栏：奇点大数据

对PRISMA的研究已经持续了一周了。虽然还没有完全破解PRISMA最终各种滤镜算法的奥妙，但是确实得到了不少宝贵的信息。

喏，比如上次，我们就找到了这篇著名的论文《Image Style Transfer Using Convolutional Neural Networks》。经过反复的测试，我发现一个问题，那就是关于收敛速度的问题。

要知道，在全世界有至少几百万人在用PRISMA，这本身是需要系统能够容纳比较高的并发，而且要有极好的浮点运算效果的。可是《Image Style Transfer Using Convolutional Neural Networks》这篇论文中说到的效果是一个“逼近”式的算法，学名叫梯度下降——或者是其变种随机梯度下降。也就是说，用一张白纸打底，然后通过一次一次往白纸上更新色块，然后判断涂鸦后的画面信息与“大师风格”和“照片内容”的差异值（LOSS函数值）是否降低，然后循环往复。

在测试中，一副1024p的图经过1000轮左右的循环大概需要消耗掉32个CPU50%的运算时间，并且持续将近10分钟。这哪里是什么高并发系统，就是个批处理系统啊。就算是使用NIN MODEL代替VGG-19进行优化的情况下，处理速度也只能缩短到原来的35%左右，还是远远不及PRISMA的10秒出图的效率。

有的朋友可能认为，上GPU矩阵就行了，用强大的CUDA摆平这一切。不过这种愿望是美好的，但是算一算就知道其实即便用CUDA GPU集群仍然不能达到在高并发下的PRISMA处理效率，差着数量级呢，尤其是在产生并发的时候。

不过，好在这种东西具体事例一幅风景画风格的时候，还是不错的，而人像是莫名粗糙。

这里我们就用梵高的星空和珠海的金山软件大厦做个“融合”吧，还真有一些韵味，用那广告词儿怎么说来的——用了点深度学习，嘿，还真对得起咱这张脸。所有的风景类型的，这么用问题都不大。

然而，在这个处理方式上我们可以看到，笔触被机器模拟得惟妙惟肖的，而对比PRISMA我们就发现，太糟糕了，这种惟妙惟肖的油画笔触会毁掉整幅图的美感。

所以从处理速度的方面和笔触处理来说，PRISMA都极不像是用深度学习网络《Image Style Transfer Using Convolutional Neural Networks》论文的指导思想来处理的，反而更像是用类似Photoshop中的滤镜特效。看看咱万娟妹妹的靓照，还就是得这么处理，估计用CNN网络处理完了估计比那天被蜡笔涂鸦的某峥老师好不了多少。

内什么，上次软文发了以后，来了大量的热心读者来信，起初让老高非常感动，觉得中国有这么多人都喜欢深度学习这个领域，未来肯定是大有可为。不过后来一看其中99%是询问图里的萌妹子的联系方式的。你们别再问了啊，实在对不住，联系方式我现在也不知道了，自从发文以后妹子就把我拉黑了而且换了手机号啊。后来这不是没办法，模特又换成了亲生的前同事吗。

经过和我司的图像处理专家又进行了讨论，如果要彻底模拟PRISMA的滤镜效果，靠深度学习恐怕是多少有点不靠谱了，要从别的角度下手。