首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

SIBLING 读书会——深梦艺术

图片来源

https://blog.ttro.com/wp-content/uploads/2017/01/TB010-Deep-Neural-Network.jpg

Art in a deep dream

2015年,谷歌脑洞大开,让深度学习网络进军艺术圈儿,创作了一系列梦魇般的作品。这就是新晋网红Deep Dream,通常译作“深梦”。

图片来源https://deepdreamgenerator.com/assets/landing/img/gallery/4.jpg

除了让人窒息的才华,深梦还随身携带问题三连:深梦作品是不是艺术?是哪种艺术?深梦网络在深梦艺术中扮演着什么角色?

图片来源

https://cn.best-wallpaper.net/Vincent-van-Gogh-Starry-Night_wallpapers.html

简单粗暴的答案三连:深梦艺术是一种人类目前不能充分解释但能欣赏的生成艺术。

生成艺术什么鬼

Galanter (2003)将生成艺术定义为:“在任意艺术实践中,如果艺术家通过使用某种系统,例如一套自然语言规则,一个计算机程序,一台机器或其他程序性发明,发动该系统,并使得该系统具备一定程度的自主性,以此创作或帮助创作一件艺术品,则这种艺术实践就是生成艺术。” Blackwell和Dodgson (2010)给出了另一种类似但较为简单的界定,即如果一件艺术品至少部分地由某种不受艺术家直接控制的过程所生成,那么这件艺术品就属于生成艺术的范畴。

图片来源

http://www.generative.co.za/wp-content/uploads/2008/10/fractals_generative.jpg

两种定义都强调创作过程中包含某种对艺术家来说无法完全控制的机制或过程,比如随机过程(计算机程序设计中的伪随机和抛硬币过程中的真随机)、自然过程和涌现过程。就涌现过程而言,Greenfield (2011, 110)通过一个简单的例子来解释何为“涌现”。他指出,尽管推特上的每一条推文的长度不到140个字符,但大量推文形成的网络却能具有显著的社会学意义(sociological meaning)。同理,从简单的、人类能够理解的算法出发,通过最低限度的抽象,就能发展出人类无法预测的复杂性(2011, 111)。

深梦艺术是个啥

Gayford (2015)用通俗的语言解释了深梦网络的工作原理:“该神经网络获取一张斑点满布犹如暴风雪来袭的图片,然后根据要求,借助它通过识别训练所获得的对象识别能力,从噪声中探测出任何哪怕有一丁点像那种对象的部分,并将其凸显出来,以此来调整原图片。”

例如,如果一个神经网络先前的训练材料是狗的图片,那么该神经网络将从艺术家所提供的图片中尽可能多地识别出符合狗的特征的部分,并将其突出、加强,从而生成最终的深梦艺术作品。有趣的是,深梦艺术的风格确有几分“梦境”的意味,以至于Gayford (2015)按照艺术史的标准认为可将其划分到“超现实主义”流派。按照这种对深梦网络工作原理的解释,深梦网络和其他用于生成艺术的计算机程序似乎没有区别,双方都是有一定自主性的系统,且艺术家不能提前预测最终艺术品的细节。

图片来源

http://images.fineartamerica.com/images/artworkimages/mediumlarge/1/surreal-owl-portrait-deep-dream-with-dogs-matthias-hauser.jpg

问题在于,目前人们普遍认为尚不能解释深度学习网络的学习机制。虽然人们能够描述深度学习网络能做到什么,但却不能解释它为什么能做到这些。人们甚至不能解释为何在某些情况下深度神经网络会出错。例如,研究发现即使将一幅对人类来说完全无法识别的图片呈献给深度学习网络,该网络也能将该图片以99.99%的自信度识别为某个物体。换言之,人们可以制造一张充满“噪声”的图片来欺骗深度学习网络,令其错误地从噪声中识别出某个图像(Nguyen, Yosinski and Clune, 2015)。另一项研究则表明,以人眼无法发现的方式改变某图片,可以导致深度学习网络将该图片识别为另一种完全不同的物体(Szegedy, Zaremba, Sutskever, Bruna, Erhan, Goodfellow and Fergus, 2013)。这两个例子表明,人们不能提前预知在何种情况下深度学习网络有效,也无法确定在何种条件下深度网络将失效。也就是说,人们并不能令人满意地解释深度学习网络(包括深梦网络)。

不能解释照样美

惯常的观点是,不可解释性意味着某些审美体验的缺失。即当创作者或欣赏者不能充分解释创作工具的工作原理时,就会错过某些审美体验。Blackwell和Dodgson (2010)认为,对大部分人来说,计算机生成的图像仍然和装饰性艺术联系紧密,而所谓的“审美”也局限在“悦目”(pleasing to the eye)的层次上。McCormack et al. (2014) 也认为缺乏编程知识将导致欣赏者只能关注计算机艺术作品的表面细节。Boden (2016)指出编程能力是欣赏计算机艺术的关键,大部分人由于缺乏对编程的理解,将无法全面地欣赏计算机艺术;即使欣赏者对编程有粗浅的理解,也仍然不足以使之能欣赏计算机图形艺术所包含的创造性编程技巧。显然,Boden将用来生成计算机视觉艺术的编程技巧——即生成过程——也视作该艺术的美感来源之一。此外,缺乏编程知识,不仅导致无法识别用来创造艺术的技巧,也影响对不同艺术创作之间的比较。不了解这些编程技巧将导致欣赏者无法感受以之为基础的计算机艺术的魅力。

图片来源

https://www.creativityfuse.com/wp-content/uploads/2010/10/Jared-Tarbell-Peter-De-Jong-January-2004.jpg

尽管上述观点正确地指出背景知识对审美体验的必要性,但却忽视了背景知识的缺乏并非不能带来新的审美体验这一事实:在某些情况下,创作工具或创作过程的不可解释性反而能够给艺术家和欣赏者带来独特的审美体验。心理学研究表明,艺术作品的内容可能是不确定的(Biaggio and Supplee, 1983),而视觉刺激的复杂性对美感判断有显著影响(Berlyne, 1970),而新奇性和惊奇感应当被视作艺术互动(art interaction)的目标(Berlyne, 1974)。例如,总的来说,包含更多元素(即内容更复杂、更不确定)的图片被认为是更漂亮的(Jacobsen, Schubotz, Höfel and Cramon, 2006)。

封面来源

http://tacticallegends.com/wp-content/uploads/2016/08/AI.jpg

参考文献

1 Berlyne, D. E. (1970). Novelty, complexity, and hedonic value. Perception & Psychophysics, 8(5), 279-286.

2 Berlyne, D. E. (1974). Studies in the new experimental aesthetics: Steps toward an objective psychology of aesthetic appreciation. Washington, DC: Hemisphere.

3 Biaggio, M. K., & Supplee, K. A. (1983). Dimensions of aesthetic perception. The Journal of Psychology, 114(1), 29-35.

4 Blackwell, A. F., & Dodgson, N. A. (2010). Computational aesthetics as a negotiated boundary. Leonardo, 43(1), 88-89.

5 Boden, M. A. (2016). Skills and the appreciation of computer art. Connection Science, 28(2), 131-138.

6 Galanter, P. (2003). What is generative art? Complexity theory as a context for art theory. In In GA2003–6th Generative Art Conference.

7 Gayford, M. (2015). REVIEWS - Apprentice Work-What is the potential of machine art, and can it truly be described as creative or imaginative?. Technology Review-Massachussets Institute of Technology-English Edition, 119(2).

8 Greenfield, G. (2011). Generative art: a practical guide using Processing. New York: Manning Publications.

9 Jacobsen, T., Schubotz, R. I., Höfel, L., & Cramon, D. Y. V. (2006). Brain correlates of aesthetic judgment of beauty. Neuroimage, 29(1), 276-285.

10 McCormack, J., Bown, O., Dorin, A., McCabe, J., Monro, G., & Whitelaw, M. (2014). Ten questions concerning generative computer art. Leonardo, 47(2), 135-141.

11 Nguyen, A., Yosinski, J., & Clune, J. (2015, June). Deep neural networks are easily fooled: High confidence predictions for unrecognizable images. In 2015 IEEE Conference on Computer Vision and Pattern Recognition (CVPR) (pp. 427-436). IEEE.

12 Szegedy, C., Zaremba, W., Sutskever, I., Bruna, J., Erhan, D., Goodfellow, I., & Fergus, R. (2013). Intriguing properties of neural networks. arXiv preprint arXiv:1312.6199.

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171222G0Q65B00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券