前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >破解PRISMA(中)

破解PRISMA(中)

作者头像
刀刀老高
发布2018-04-10 18:09:20
1.1K0
发布2018-04-10 18:09:20
举报
文章被收录于专栏:奇点大数据奇点大数据

对PRISMA的研究已经持续了一周了。虽然还没有完全破解PRISMA最终各种滤镜算法的奥妙,但是确实得到了不少宝贵的信息。

喏,比如上次,我们就找到了这篇著名的论文《Image Style Transfer Using Convolutional Neural Networks》。经过反复的测试,我发现一个问题,那就是关于收敛速度的问题。

要知道,在全世界有至少几百万人在用PRISMA,这本身是需要系统能够容纳比较高的并发,而且要有极好的浮点运算效果的。可是《Image Style Transfer Using Convolutional Neural Networks》这篇论文中说到的效果是一个“逼近”式的算法,学名叫梯度下降——或者是其变种随机梯度下降。也就是说,用一张白纸打底,然后通过一次一次往白纸上更新色块,然后判断涂鸦后的画面信息与“大师风格”和“照片内容”的差异值(LOSS函数值)是否降低,然后循环往复。

在测试中,一副1024p的图经过1000轮左右的循环大概需要消耗掉32个CPU50%的运算时间,并且持续将近10分钟。这哪里是什么高并发系统,就是个批处理系统啊。就算是使用NIN MODEL代替VGG-19进行优化的情况下,处理速度也只能缩短到原来的35%左右,还是远远不及PRISMA的10秒出图的效率。

有的朋友可能认为,上GPU矩阵就行了,用强大的CUDA摆平这一切。不过这种愿望是美好的,但是算一算就知道其实即便用CUDA GPU集群仍然不能达到在高并发下的PRISMA处理效率,差着数量级呢,尤其是在产生并发的时候。

不过,好在这种东西具体事例一幅风景画风格的时候,还是不错的,而人像是莫名粗糙。

这里我们就用梵高的星空和珠海的金山软件大厦做个“融合”吧,还真有一些韵味,用那广告词儿怎么说来的——用了点深度学习,嘿,还真对得起咱这张脸。所有的风景类型的,这么用问题都不大。

然而,在这个处理方式上我们可以看到,笔触被机器模拟得惟妙惟肖的,而对比PRISMA我们就发现,太糟糕了,这种惟妙惟肖的油画笔触会毁掉整幅图的美感。

所以从处理速度的方面和笔触处理来说,PRISMA都极不像是用深度学习网络《Image Style Transfer Using Convolutional Neural Networks》论文的指导思想来处理的,反而更像是用类似Photoshop中的滤镜特效。看看咱万娟妹妹的靓照,还就是得这么处理,估计用CNN网络处理完了估计比那天被蜡笔涂鸦的某峥老师好不了多少。

内什么,上次软文发了以后,来了大量的热心读者来信,起初让老高非常感动,觉得中国有这么多人都喜欢深度学习这个领域,未来肯定是大有可为。不过后来一看其中99%是询问图里的萌妹子的联系方式的。你们别再问了啊,实在对不住,联系方式我现在也不知道了,自从发文以后妹子就把我拉黑了而且换了手机号啊。后来这不是没办法,模特又换成了亲生的前同事吗。

经过和我司的图像处理专家又进行了讨论,如果要彻底模拟PRISMA的滤镜效果,靠深度学习恐怕是多少有点不靠谱了,要从别的角度下手。

就像我们上一个解决的课题,破解一个卡通特效的滤镜,也没有用深度学习网络哦,还不是效果杠杠的。

嗯,方向基本明确了,加油加油。

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2016-08-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 奇点 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档