人工智能会成为伟大的作曲家吗?

开始读文章前,我们先来玩个游戏,下面两首曲子,有一首是肖邦创作,另一首是由人工智能模仿肖邦的风格所创作。

听听看,你能听出哪一首是人工智能创作的吗?

正确答案:第首曲子由人工智能创作。

(我会在一周之后在横线上填上正确答案。)

长文预警 烧脑预警

本文大概

7626

读完共需

20

分钟

人工智能(下文中与缩写“AI”混用)是否能作曲,这个问题如今已经没有什么争议。

清华大学x-lab的小伙子们开发的DeepMusic能够通过简单勾选风格、乐器、情绪、时长等标签自动生成个性化的音乐。

百度的人工智能团队开发了能够 “看图作曲” 的AI,并现场演示了针对梵高《星月夜》、徐悲鸿的《奔马图》以及罗伯特·劳森伯格《四分之一英里画作》等画作进行的配乐。

罗伯特·劳森伯格《四分之一英里画作》

在游戏《古墓丽影:崛起》中,游戏的背景音乐由AI即时生成,随着游戏人物移动速度及场景的不同(如野兽出没),音乐的节奏音量都会随之发生变化,为玩家营造如临其境的体验。

你甚至可以自己体验这个过程,你只需在AmperMusic注册一个账号,进行几项选择,就能定制属于你的个性音乐。

AmperMusic

比如下面这个片段就是我在网站生成的一段30秒的AI原创音乐。

不能否认,这些人工智能所创作的音乐,虽然挺新奇,也挺好听,但都是些短小的片段,大家通常只是拿来娱乐一下,并不会太把它当一回事儿。

我们可以接受人工智能在路线规划上秒杀人类,在围棋比赛中战胜人类,比人类医生更精确快速的诊断疾病,但是艺术和音乐——这是人类思想灵魂最深处的,最不可接近的神圣领域,我们会本能的否认AI能够达到与我们相同的高度,更不用提超越我们。

事实真是如此吗?

在这篇文章中,我想讨论的,正是这个触及人类心理最脆弱敏感之处的话题。

是否会有那么一天,人工智能可以成为与莫扎特、贝多芬一样伟大的作曲家呢?

让我们暂且抛开人类万物灵长的骄傲,以客观的态度审视正在发生的事实,希望这篇文章,能够带给你一些全新的角度与思考。

我们先从大家都熟悉的故事讲起。

1997年5月11日,IBM研发的超级计算机“深蓝”在比赛中战胜了国际象棋世界冠军卡斯帕罗夫,这场比赛在当时可谓轰动一时。

想要知道这个结果给那时的人们带来多大的心理冲击,我们首先得了解败在深蓝手下的卡斯帕罗夫。

卡斯帕罗夫可不是普通的世界象棋冠军,他会说15国语言,还是一位数学家。他6岁开始下棋,15岁成为国际象棋大师,共23次获得世界冠军,曾1人同时应战来自75个国家50000名象棋爱好者组成的“世界队”并最终取得胜利。

说他是站在人类智商巅峰的男人,一点儿也不过分。他最终输给了冰冷的电脑,也难怪全世界都对这个结果议论纷纷。

IBM 深蓝 战胜卡斯帕罗夫

不过对于科学家而言,这个结果一点儿也没有出乎意料。无论从理论还是技术上看,在国际象棋领域,人类输给电脑只是时间问题。

早在20世纪初,德国数学家恩斯特·策梅洛就已经证明,在二人有限游戏中,如果双方均能获得完全且对等的信息,且不考虑任何运气或随机因素,则参与者必有一方有必胜或必败策略(策梅洛定理,Zermelo's theorem)

举个现实中的例子,会玩五子棋的朋友应该清楚,执黑先行是有必胜策略的,因此在正式比赛中会引入相应规则,三手后双方交换盘面,且黑方有禁手规则,以限制执黑子的巨大优势。

换句话说,只要电脑算力水平足够,就一定能把这个优势策略算出来。

那么战胜人类冠军的电脑“深蓝”在当时又是怎样的来头呢?

“深蓝”并不是那个时代最强大的计算机,单论计算能力,它排不进那个时代的前十,甚至前100名都排不上号——它在1997年6月的世界超级计算机榜单中,排在第259位。

1997年6月 世界超级电脑榜单(数据来源:http://top500.org/)

它战胜卡斯帕罗夫的方式也非常简单粗暴,简单描述就是针对对手的每一步落子计算出下一步、下下一步等等所有可能出现的局面,从中选择优势最大的一种。

而且“深蓝”的算法针对卡斯帕罗夫进行了专门的优化设计,可以说对手的每一手棋,都在其意料之中。在这种情况下,卡神焉有不败之理?

不过,在那个年代,针对另外两个方面,人们还是有所共识的。

其一,是卡斯帕罗夫永远不可能翻盘,因为对弈结束后,深蓝就被IBM回收拆解。

其二,是那时没有多少人认为,在围棋领域,电脑也能像“深蓝”一样碾压人类。

原因,刚才我们在文中已经提到了,围棋的复杂程度,要比国际象棋高出许多个数量级。

这里我们需要定量的描述一下这句话的意思,评估棋类游戏的复杂程度,我们通常用到“博弈树复杂度(Game-tree complexity)”这个概念(并不是唯一判断依据),大致相当于,这种游戏所有可能具的盘面数量。

围棋的博弈树复杂度,是10的360次方,这个数字比全宇宙所有原子的数目还要大。

各种博弈游戏复杂度(数据来源:Wikipedia)

另:那三种比围棋还复杂的游戏是 印度斗兽棋(Arimaa) 西洋陆军棋(Stratego)无限国际象棋(Infinite chess)

更何况,在19*19共361个交叉点的围棋棋盘上,每落一子对局面所产生的影响,也远非64个棋盘格的国际象棋所能比的。

国际象棋与围棋棋盘

如果按照“深蓝”的运算方式,计算机的算力再强大,终究也只能绝望。

而对于我们人类呢?在运算推理方面,我们远远落后于计算机,这是不争的事实。

但我们不光会计算,人类的思维领域中,还有另一种神奇的能力,这种能力让我们能够在极其复杂的局面中一眼看到问题的核心,能让我们无需计算就能在棋盘上落一子而估算几手之后的局势。

我们无法精确的描述这种思考过程,甚至没有一个专门的名词来形容它,我们通常称其为“直觉”或“感觉”,还有个更玄妙的词儿,叫做“道”。

道可道,非常道,更非只会二进制的计算机所能道。在“深蓝时代”,我们人类还是能骄傲的俯视我们的造物。

计算机也许很聪明,但它不拥有智慧,更不具备灵魂。

但是,等等,后来的故事,似乎并没有按照我们既定的剧本表演。

2016年3月,谷歌的人工智能阿尔法狗(AlphaGo)横空出世,以4比1的成绩战胜了职业九段李世乭,在那之后的一年时间里,阿尔发狗以Master为账号在网络平台上与中日韩数十位围棋冠军对决,连续60局,无一败绩。

2017年5月,“深蓝”战胜人类20年后,在乌镇的世界围棋峰会上,阿尔法狗以3比0战胜世界排名第一的围棋世界冠军柯洁。

Google AlphaGo 战胜柯洁

在那之后几个月内,AlphaGo Zero、野狐、绝艺、CGI等围棋AI纷纷面世,在网络上掀起无数场大战,围棋世界第一的宝座更替频繁,只是已没了人类的位置。

围棋这个阵地,人类失守了,而且一败到底,溃不成军。

不是说好了,像深蓝那样思考,计算机无论如何也不可能在围棋领域超越人类吗?

是啊,这话并没毛病,关键问题在于,阿尔法狗并没有像深蓝那样思考。

深蓝的思考方式,相当于一个拥有无限记忆的人背过了所有可能的棋谱,对弈时所有可能出现的局面它都见过,自然知道最优策略是什么。深蓝的计算基本靠蛮力推演,可以说非常人工,但并没有多么智能(极小极大策略及剪枝算法)。

阿尔法狗则不同,虽然它也需要在之前录入大量的棋谱,但它并不分析这些棋谱的具体意义,只是将其模式抽象为数字信息存储(卷积神经网络与深度学习)。落子时,阿尔法狗并不确切知道下一步怎么落子是绝对优势选择,它也不关心(也没这个能力)若干手之后局面会是个什么样子,他只是知道把子落在哪里赢的概率会更大一些(蒙特卡洛树搜索)。

对比一下,深蓝的思考方式直白明确,我们可以明确知道它每一步决策的原因是什么,它后面的每一步会怎么走;而阿尔法狗,它的思维对我们来说就是一个黑箱,我们无法精确描述它的思考过程是什么,只知道它的每一步都是为了实现最终目的——让赢的概率更高一些。

好了,讲到这里,请大家思考一下,阿尔法狗的思考框架,还能应用到什么领域呢?

我先来说一个——计算机图像识别。

不少朋友的手机相册,都有自动将照片按照面孔自动分类的功能。

Apple iOS 的面孔识别功能

不知大家有没有想过,这个功能是如何实现的呢?计算机又是怎么知道照片里不同表情不同年纪的人都是谁呢?

这个过程,与阿尔法狗下围棋的过程,其实并没有本质区别。计算机并不确切知道照片中的人都是谁,只是通过算法将所有图片转换为数据,而后判定具有相似数据特征值的那部分,有更高概率是同一个人。

也正因为如此,这个识别过程也会犯错,会将一些只是数据特征相似然而实际上并无关系的图片归为一类。

像吗?

这个时候,就需要你手动进行调整了,而计算机则会记录下你的调整过程,更新自己的分类策略。你调整的越多,分类也就越精确。

我们再进一步应用这个算法。

在艺术领域,我们经常将类似的绘画作品归为一类风格,许多著名画家的作品,也都有其鲜明的风格特征。

梵高 向日葵 与 自画像

这种特征可以表现在选题、用色、笔触等等各个方面,你也许不会描述,但一定能感觉出类似的画作出自同一画家之手。

那人工智能能够自动将同一画家的画作进行归类吗?

按照我们前文讲到的逻辑,这个任务对于计算机而言一点儿难度也没有,分分钟就能实现。不仅如此,人工智能还能将每种绘画风格的特征值提取出来,应用到任何图片或照片之中。

也就是说,借助人工智能,你可以请来任何大画家为你绘制肖像。

我们以这张拉赫玛尼诺夫年轻时的照片为例,先让AI上色,将其变成彩色照片(Algorithmia项目)。

人工智能上色

再让AI将其变成毕加索自画像的风格(Deepart项目)。

毕加索风格的拉赫玛尼诺夫肖像

好了,到这里,我们先来总结一下,什么是艺术风格。

针对已经完成的艺术品,艺术风格是艺术家在创作艺术作品时,内容与形式中表现出的一致的思想倾向和创作特色。

我们换用一个极简但不怎么精确的词儿来形容,就是艺术家进行艺术创作时形成的习惯。

艺术风格通常无法用语言精确描述,只能概括的总结。更多情境下,我们只能凭借 “感觉” 将其识别出来。

现在人工智能也能做到这一步了,它与我们一样,无法将这个过程明确解释出来,我们只知道它能通过更多的材料输入(深度学习),输出越来越接近艺术家风格的作品。

所以,只要有足够强的需求和足够丰富的运算资源,理论上人工智能完全可以做到比任何现代画家画的更像梵高。

下面,我们正式进入音乐领域。

音乐也是一种艺术形式,自然也有不同的风格,也可以进行风格的迁移。

人类自己就能很好的完成这个过程。比如披头士的《hey jude》:

我们用巴洛克风格包装一下,这首曲子就能变成下面这样。

音乐风格的迁移,与绘画风格的迁移本质上并没有什么不同。经过前文的论述,大家应该清楚,让人工智能来做这事儿,并没有什么难度。

按照某位作曲家的创作风格从零开始生成一首曲子,也很容易做到。

文章开始时那两首玛祖卡,一首是肖邦所做,另一首是加州大学圣克鲁兹分校教授大卫·科普(David Cope)开发的 “音乐智能实验(Experiments inMusicalIntelligence,后文统一缩写为EMI)”所创作。

大卫·科普(David Cope)

著名认知神经学家,《哥德尔、埃舍尔、巴赫: 集异璧之大成》的作者侯世达(Douglas Hofstadter)曾用这两段音乐测试了伊士曼音乐学院的讲师教授,几乎没有人能准确的分辨人工智能与肖邦的创作。

侯世达与他的著作

大卫·科普于1981年开始进行EMI的研制开发,比深蓝的诞生还要早15年,EMI的初始算法非常简单机械,就是将能搜集到的尽可能多的音乐作品拆解成片段和基本单元,再按照规则进行重组和变化,最后抹平形式上突兀的部分,形成一部新的作品。

EMI早期的创作非常僵硬稚嫩,然而随着新算法的应用和硬件的升级,它的创作越来越接近人类,直至与作曲家的创作风格别无二致。

在完成那本著名的《集异璧》时(1979年),侯世达并不看好计算机作曲。他认为“用一台批量生产的,花20块钱邮费邮购获得的装满贫乏电路的盒子,创作出肖邦或是巴赫活到今日写出的曲子,这种念头,哪怕只是想想就已经是对人类心智深度最荒诞可耻的误估。”

他会演奏钢琴,非常喜欢巴赫与肖邦的音乐,自认为“没有什么伪造的肖邦的曲子能骗过他的耳朵”,可是听过EMI的创作后(1995年),他完全分辨不出AI与肖邦的差别。他受到了极大的震撼:“如此饱含感情的音乐,怎么能从一个从未听过一个音符,从未活过一分一秒,从未有过一丝一毫情感的程序中谱写出来?”

好吧,也许人工智能确实能完美模仿人类作曲家,但这并不代表它就能成为伟大的作曲家。我在网上找了一些关于人工智能作曲的讨论,支持机器永远无法超越人类的论点主要有三个:其一,是人工智能只能创作简单短小的音乐片段,遇到诸如交响曲、协奏曲这样复杂的大部头时,也就歇菜了;其二,是人工智能只能从已有的音乐素材汲取资料,沿着人类预制的路线进行创作,它可以模仿人类,却永远无法形成自己的创作风格;其三,AI没有人类的感情,不肯能创作出情感丰富的音乐作品。

下面,我们来逐一讨论这三个论点。

首先,人工智能无法创作大部头,这句话并不完全正确。

协奏曲、交响曲等,需要管弦乐队演奏的多乐章、大部头作品的复杂严谨程度确实要远远超过钢琴上的玛祖卡舞曲,但我们前面讲阿尔法狗的时候已经说到了,如今的人工智能并不是简单的暴力穷举,它不仅不怕复杂的、无法描述的任务,甚至可以做的比人类更好。

至于创作大部头音乐所需要的灵感和素材,只要用于训练的资料库足够大,AI可以在几秒钟之内经历一个人的一生。

事实也是如此,大卫·科普的EMI从未停止过进化,它完成了模仿肖邦和巴赫的任务后,又补完了肖斯塔科维奇没有完成的“第10奏鸣曲”,它的创作列表还在一直扩增,总有一天,它的创作数量会超过任何一个已知的人类作曲家。

而且,世界上能创作音乐的人工智能绝不仅EMI一个(或者一位?我该用哪个量词合适?)。我们再来听一首法国团队开发的人工智能Aiva的作品,a小调交响幻想曲,标题是 “我是人工智能”(Symphonic Fantasy in A minor, Op. 24, I am A.I.),由阿维尼翁交响乐团演奏。

哦对了,还有个事儿我要提一下,这个(位)人工智能Aiva,已经被正式吸收为法国与卢森堡作曲家协会首位非人类会员。

Aiva被官方认可为作曲家(消息来源:AI Business)

再来看,计算机只能模仿,无法形成自己的创作风格这一观点。

我们还是回到阿尔法狗的故事中,来看一下这个质疑是否有道理。

在阿尔法狗的第一个版本中,科学家为其提供的学习材料是巨量的历史棋谱。相当于告诉阿尔法狗,人类高手是这样下围棋的,你好好学哦!

这一版本的阿尔法狗表现并不十分出彩,实力虽强于大多数高手,但还无法战胜最顶尖的人类棋手。

在第二个版本中,科学家调整了阿尔法狗的算法,用人类棋谱作为基础,让阿尔法狗自己与自己对弈,生成大量人类对局中从未出现的局面,再从中学习。

这相当于对阿尔法狗说:“别管那些愚蠢的人类了,去寻找你自己的制胜手段吧!”

阿尔法狗的棋艺也正是从这时起全面超越人类的,而这一算法从部署完成到完成训练,一共花了三天时间。

相当于,三天前一个完全不懂围棋的人,经由三天自己与自己的左右互搏,最终打败全天下高手,登上棋王宝座。

所以,从这个事例也能看出,人工智能并不是不能创新,相反倒是人类的已有素材限制了AI的发挥。让AI自己探索,它完全可以超越人类的想象,形成自己的音乐创作风格。

至于这第三个问题,AI不具备人类的情感,这句话没毛病,但这并不等同于它无法创作出能影响人类情感的音乐作品。

人类情感的本质是什么,至今还没有哪位生理或是心理学家敢说自己能将这个问题解释清楚。但是可以确定的是,想要唤起人们的情绪,一点儿也不难,只要一种色彩,一种气味,一种味道,或是一首童年听过的老歌就足矣。

对于AI而言,它并不需要具备感情,只要它对你足够了解,就一定能创作出你喜欢的,能让你产生共鸣的艺术作品。

讲到这里,似乎这篇文章的观点已经非常清晰,人工智是否能成为伟大的作曲家,只是时间问题了。

仔细琢磨一下,确实细思极恐。

人类曾认为永远无法被计算机超越的思维,已经被计算机超越;而音乐,这块人性与灵魂的瑰宝,也已然被人工智能采撷。

我们不能不扪心自问,既然如此,我们为何还要创作音乐,我们为何还要演奏音乐?既然在与AI的创作竞赛中,人类永远也无法翻盘,何不把这一切全部交于人工智能?

这个问题的答案,恰恰蕴含在这个问题中。

因为我们会质疑和探索音乐与人生的意义,因为我们每人只有唯一一段独特的人生,因为我们会欣赏音乐,这才是我们与计算机最根本的不同。

一方面,人工智能可以以人类望尘莫及的效率完成各种任务,但是对于计算机而言,一件任务只有初始状态、处理过程和终止状态,它永远不会去检视自己完成任务的意义。

反观人类音乐的发展,当人们质疑为何音乐只能是教堂中的人声吟诵时,音乐走出了中世纪;让人们思考如何才能让音乐更富细节和层次感时,巴洛克时代来临了;当我们开始反思我们的音乐中充斥的精致浮华时,音乐开始走向古典主义;当我们想要通过音乐抒发自己的激情时,浪漫主义到来了……

对于人类,音乐不光是音符与旋律,也是一段可以回溯的历史,更是许多记忆与故事,这也正是音乐对于我们的意义,这一切,人工智能无法体会。

另一方面,我们每个人,都是不同的个体。我们出生、成长、成熟、衰老……我们每个人的人生经历都各不相同。

正因如此,同一段音乐,对于不同人而言,具有不同的意义。它可以让一些人痛哭流涕,另一些人对其却无动于衷。

音乐并不因它被创作出来而赋予意义,音乐因为被人欣赏才有了价值。

AI可以创作音乐,但它不能欣赏音乐。如果从这个角度再看这篇文章提出的那个问题,人工智能能够成为伟大的作曲家吗?你会发现,人类终于扳回一局。

音乐不是对弈,不以输赢为评判标准,音乐也没有好坏之分,人工智能是否能成为伟大的作曲家,这个问题,由我们人类说了算。

我是说,至少到今天为止,还是我们人类说了算。

以现在科技发展的速度,未来来的越来越快,鬼知道是否有一天,人工智能是不是真能学会欣赏音乐。

在前文中我们提到,人工智能的思维方式,对我们来说完全是一个黑盒,我们只知道它能出色的完成我们布置给它的任务,却并不清楚它具体的思考过程。

再想想看,这与我们自己的思维过程何其相似!你在读我写的文章,你的脑中有个声音在一句句朗读这些文字,你并不知道它是谁,只知道这个声音把这些文字输入了你的大脑,与你脑中已有的资料融合交汇,你无法将你理解这篇文章的思维过程精确描述出来,更无法观察或理解别人脑中的思维过程。

人类的思维与AI一样,都是一个黑盒。很有可能,我们已经接近用计算机复现出人类的思维,如果真是如此,有两个问题我们必须直面:

1. 人工智能会有一天成为人类吗?

2. 如果我们能赋予计算机智慧,那我们的智慧,又是谁,出于什么目的赋予我们的呢?

你的看法如何呢?

祝大家赏乐愉快!

- 行走的音乐-漫游指南 -

回复“如何入门”,可以获得经典音乐的入门指导。

回复“有啥推荐”,可以获得最新的推荐音乐列表。

回复“电影”,可以获得电影中的经典音乐。

继续探索其它似曾相识的经典音乐,请回复“似曾相识”。

回复作曲家姓名,可以获得音乐家相关作品和故事。

现在支持的音乐家有巴赫、莫扎特、拉威尔、海顿、肖邦、奥芬巴赫、李斯特。

Apple用户打赏通道

打赏

行走的音乐

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180712A1VTA400?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券