从尼安德特人到机器人:人类声音演化史

图片来源:Getty

跟骨骼和贝壳的可矿化结构不同,人类的声音永远无法变成化石。正因如此,对于维多利亚时代市场上牛奶商人“半便士半品脱”的叫卖,以及原始人的发音或斗兽场上古罗马观众的喧喧嚷嚷,我们只能靠想象去感受。这些如蜉蝣般微小的瞬间,构成了人类文化史上不可触碰也无法探究的“暗物质”。

萨尔福德大学声学工程教授,同时也是作家和播音员的特雷弗·考克斯(Trevor Cox)通过著作《音波仙境》(Sonic Wonderland)成功引发了人们对于声音的关注,让读者了解到,原来物质世界里有这么多不同寻常而又隐秘难解的声音。而在此之后,他的研究精力则转到了人类演讲与谈话的本质、历史与未来的问题上,这其实一点都不令人意外。

水流淌过冰山或莫哈维沙漠的声音,或许跟圣保罗大教堂回音廊的听觉美学一样迷人,但就复杂程度而言,自然世界的音景难以和人类演讲相匹敌。毕竟后者充满了独一无二的意识情绪,能够成为区分个人身份的标识。

尽管我们已难以精确追踪到人类演讲史的起源,但根据考克斯的介绍,通过CT扫描来推断灭绝人种的耳部尺寸,以及模拟声波在原始人耳部骨骼的振动,古人类学者得出的结论是,演讲接收能力所必备的基础听觉装置至少在五十万年前便已完整成型。另外,一块源自海德堡人(大约生活在60万至10万年前)的骨骼化石证明,人类演讲能力大约在此同时出现。原始母语的起源则更难定论,不过如果参考符号艺术的出现,人类综合性语言的出现至少不会早于10万年以前。

在确定了发音起源之后,考克斯开始探索它的发展历程、神经基础、基因遗传乃至其他相关的波及面。他举例说明了进化史在人类听觉装置方面留下的深刻烙印:比起人类的讲话声,三个月大的婴儿更偏爱特定种类猴子的呼叫声。他还研究了语言与大脑间的关系。比如说,婴儿时期与人类隔绝的野孩子很难掌握语言表达能力,这表明语言能力的获取可能被限制在某一关键的发展阶段。另一方面,脑部布罗卡氏区患有肿瘤的病人依然保留有一定的语言能力,而该区域的主要功能便是促进语言表达,这表明它面对某些损伤有修复回弹能力,人体大脑功能则有结构上的流动性。遗传性语言缺陷同时又表明,语言能力的某些方面受制于基因基础。

《说得对:从尼安德特人到人工智能,人类对话的故事》

特雷弗·考克斯

当然了,声音在人的一生中并非恒定不变。青春期男性音调更低便是受睾丸素的影响。虽然很少会出现这样的情况,但声音也可能让考克斯感到不愉快,他在听著名阉人歌手历山德罗·莫雷斯奇(Alessandro Moreschi)的录音时,便对那种不自然的高音十分反感。此外,随着时间改变的还不只是个人的音色。通过创造性地利用录音档案,考克斯分析了英国广播公司美国频道节目《Alistair Cooke' Letter》的音频文件,将1947年起的早期音频与2004年最后一次播音作了对比。研究发现,阿利斯泰尔首次播音时每秒约有三个音节,最后减少到了2.4个音节。英国女王每年的圣诞演讲又为追踪声音进化提供了另一机会。结果显示,女王每十年每秒的讲话会减少一个半音。

考克斯还针对声音特征如何引起偏见与先入为主进行了有趣的研究,重新学习了汤姆·哈瑟利·皮尔(Tom Hatherley Pear)的创举,此人曾在1927年邀请广播听众对九个人进行评价,并以此展示人们如何在声音刻板印象的影响下,对讲话人的外表、性格乃至个性作出细腻而又生动的印象评价。考克斯也探索了声音、身份以及自我认知之间的关系,一名脑部受伤的病人出现了外国口音综合症,在发音和语调上出现了异常情况,并因这种异常倍感悲痛。

在当下这个充斥着假新闻、存疑事实和社交媒体泛滥的时代,考克斯特别强调声音魅力也是情有可原的。其中一方面就是演讲可信度与演讲者口音之间的联系,非本地口音往往被认为没那么真诚。此外,低音会跟力量、正直和能力联系起来。有研究显示,在2012年美国众议院中,候选人中音调更低者得到了额外4%的选票,胜出的可能性高了13%。更快的演讲速度伴随变换有致的音调和音量,同样也被人们认为更有魅力。甚至连青蛙在试图强化自身影响力时,也会降低叫声的音调。

考克斯在该书生动奇特的后半部分讨论了声音的未来以及它将如何被科技影响。麦克风或许是第一项显著改变声音的发明。以往必须在舞台上扯着嗓子的歌手得到解放,也有了创新创作的空间。就拿平·克劳斯贝(Bing Crosby)为例,得益于麦克风,他创造出了宛如耳语对话般的“轻吟”(crooning)式唱法。还有许多更为复杂的电子产品让乐队以各种特殊方式改造自己的声音,披头士(Beatles)、海滩男孩(Beach Boys)、发电站(Kraftwerk)和比约克(Björk)等均在此列。

尽管匈牙利的沃尔夫冈·凡·肯佩伦(Wolfgang von Kempelen)在18世纪发明的“说话机”只能做基本发音,约瑟夫·法伯尔(Joseph Faber)在1846年的发明也只能唱一首《天佑女王》(God Save the Queen),但考克斯对此很乐观。他认为以神经网络和机器学习形式出现的人工智能,必将彻底重构未来的声音。

现在的机器已能将发音表现得宛如受真实心理的支配,而它们能否产生意识最终可能被证明毫不相干。人类似乎有在一切可以讲话的东西上建立附属机构的趋势,我们对声音复杂的依赖同样如此。

翻译:刘欣

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180527A09IYE00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

同媒体快讯

扫码关注云+社区

领取腾讯云代金券