首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

人类语言:一座人工智能至今无法跨越的大山

随着网络、社交媒体的普及以及人工智能的兴起,语言所发挥的面对面的沟通功能大幅降低。这不禁让我们反思,人究竟是何物。

前不久,国际知名语言学者王士元先生应邀在华东师范大学“思勉人文讲座”上发表演讲。他指出,语言是人类最重要的指标——它不仅是人类和动物的分水岭,也是人工智能至今仍无法让电脑掌握的能力。

原文:《“语言是人类最重要的指标”》

作者:加州大学伯克利分校荣休教授、中国香港理工大学讲席教授 王士元

“人是何物”最关键的回答

法国画家保罗·高更提出的三个问题“我们从何处来、人是何物、向何处去”,都与语言密切相关。语言是人类最重要的指标——它不仅是人类和动物的分水岭,也是人工智能至今仍无法让电脑掌握的能力。

人是从哪里来的?第一,约600万年以前,人类与大猩猩开始分家;约350万年以前,南方古猿开始出现;约280万年以前,生物分类学上的人属开始出现;约15万年以前,智人种开始出现并成为现在人科人属中唯一幸存的种,但智人曾和尼安德人、丹尼索瓦人等其他人种有过基因交流。第二,直立行走是促进人类演化的重要标志,它有利于手脚分工、使用工具,有利于视野开阔、大脑发展,有利于喉头下降、促进言语发声。第三,尽管基因高度趋同,但和其他灵长类动物相比,人类具有以下显著特征:其一,直立行走、手脚分工;其二,脑容量大,约1400 cm3;其三,能使用语言,拥有高级思维,这其实也是对“人是何物”最关键的回答——人是有语言的动物!

于外,语言是我们沟通交流最重要的工具;于内,语言是我们思维最基本的载体。但在论述语言的特征、起源与谱系之前,我们先了解一下其他动物的沟通方式。

研究其他动物的行为、感知和沟通方式,对我们了解智能很有必要。比如德国的Karl von Frisch就率先发现了蜜蜂的舞蹈语言:蜜蜂能够利用∞形舞(亦称“摆尾舞”)的频率与角度传递蜜源的距离和方位信息;不同地区蜜蜂的摆尾舞有不同的舞蹈形状和时间节奏。

奥地利的Konrad Lorenz发现,刚出生的小鸭子是通过“印刻行为”(imprinting)找妈妈的,即它们会把看到的第一个能动的物体当做自己的妈妈。

英国的Peter Marler研究了同一座山中的白冠带鹀和北美歌雀它们的雏鸟如何学会各自属种的鸣叫。结果表明,鸟类习得鸣叫和人类习得语言存在两大相似点:一是习得时都存在时间限制,即关键期(criticalperiod),对白冠带鹀而言大约是出生后前50天。二是习得前都存在学语期,婴儿是牙牙学语(babbling),雏鸟是吱呀初鸣(subsong)。

而新近的研究,如Virginia Morell(2014)在Science第344期上发表了论文“When the bat sings”,证实了蝙蝠也拥有非常复杂的、有规律的沟通系统。关于动物的沟通方式我们不再做过多介绍,如果有兴趣可以参看我1991年主编的The Emergence ofLanguage: Development and Evolution(《语言涌现:发展与演化》王士元主编、林幼菁译,2008)。

语义系统:人工智能的关键难题

人类主要依靠语言进行沟通,那么语言具有什么样的特征呢?1960年,美国语言学家Hockett在Scientific American第203期上发表了论文“The origin of speech”,文中他提出了13种设计特征(design feature)来阐释人类语言的独特性:声耳渠道、四散传播定向接受、迅速消失、互换性、整体反馈、专门化、语义性、任意性、分离性、跨越时空、能产性、传统传播和模式二重性。通过比较人类和其他动物沟通方式所利用的特征差异,他认为,只有人类语言才能涵盖全部设计特征。

其中,任意性(arbitrariness)是人类语言一个很重要的基本特征,即语言符号的音义结合关系是任意的、约定俗成的。战国荀子早已提出类似的洞见:“名无固宜,约之以命,约定俗成谓之宜,异于约则谓之不宜”、“名有固善,径易而不拂,谓之善名”。当然,这种“任意”并非“完全、绝对任意”。如图1所示,假设有一个大家都不会说的语言中有两个词:kiki和booba,它们各自指称的是左图还是右图呢?如果拿这个图询问不同语言背景的受试者,许多人会认为kiki指称左图,booba指称右图;因此,语音和语义之间还是可能存在某种关系的。加州大学圣地亚哥分校的Ramachandran 和Hubbard(2001)在Journal of Consciousness Studies 上发表了论文“Synaesthesia: A window into perception, thought and language”,他也举了很多例子来说明语音和语义之间的结合关系并不是完全任意的。

当然,我个人认为还有一个虽未被Hockett提及但也与语言密切相关的特征,就是“歧义(ambiguity)”。汉语中就有许多这样的例子。比如“鸡不吃了”就可以有两种解读:“不吃鸡了”和“鸡不吃东西了”,前者将“鸡”理解为“吃”的受事,后者则理解为“吃”的施事。再如“我们没有做不好的事情”也存在两种歧义理解:一种是“我们没有做坏事”,另一种是“没有什么事情是我们做不好的”,分歧在于“做”与“不好”的结合关系。

其他语言中的歧义句也不胜枚举。比如英语It’s too hot to eat中的it可以有不同的指称,hot也有两个基本义项(热和辣),故组合起来就可能有不同的涵义。再如日语“学生が好きな先生”也有两种意思,即“喜欢学生的先生”,“学生喜欢的先生”。所以,人类语言高维的、复杂的语义系统也是当前人工智能领域所面临的关键难题。

另外需要强调的是,语言并不是一种特殊的器官,而是建立在很多已有能力基础上的。1962年,人工智能领域的开拓者之一Herbert Simon就曾经指出:只有等到动力系统中不同的功能(如呼吸、发声、咀嚼等)交互在一起并同步化,语言才能获得原动力(initial boost),人也才能拥有复杂的思想。1978年,我在印度的一次题为“Explorations in language evolution”的讲演中也提出了类似的主张:“在人类演化中,这些能力也许比语言更早出现,渐渐一步一步地,这些能力在语言精练的过程中越来越为人所运用,好像完成了一片片的马赛克拼贴画一样。同样地,这些能力也被运用在其他精细的人类组织中,特别是在数学与音乐方面。”

语言的起源更可能是“多源的”

和人类起源理论一样,语言起源理论也存在“单源论”(monogenesis)和“多源论”(polygenesis)的争议。但语言起源的性质可能和人类起源不大一样。

作为一个物种,人类的起源更可能是“单源的”。从化石证据上看,迄今发现的最早阶段的人类化石大多在非洲(如“少女Lucy”遗骸)。而从基因证据上,目前母系和父系的DNA研究也都支持“非洲起源假说”(The Out of Africa Hypothesis)。

线粒体DNA的结构类型是反映母系脉络的重要指标。1987年,我在伯克利指导的研究生Rebecca Louise Cann及其同伴在Nature第325期上发表论文“Mitochondrial DNA and human evolution”,她提取并比较了胎盘中的线粒体DNA,结果显示:在140多个胎盘中,最早开始分化的7个全部为非洲裔。

Y染色体(Y chromosome)则仅表现为父系遗传。斯坦福大学的研究人员(Underhill、Shen、Lin等,2000)在Nature Genetics第26期上发表了论文“Y chromosome sequence variation & the history of human populations”。他们从Y染色体的序列变异中考察了人类父系脉络的谱系,结果与母系线粒体DNA的考察结果类似,最先分出来的8个Y染色体也全部为非洲裔,这再一次佐证了“非洲起源论”的合理性。在此基础之上,他们首次绘制了全球的人类演化迁徙地图,并认为,大约在10万年前,现代人从起源地非洲开始四散迁徙,并在不同的时间到达不同的区域。

相较于人类的起源,我认为语言的起源更可能是“多源的”。1996年,Freedman和我在Anthropological Science第104期上合著过一篇文章“Language Polygenesis: A Probabilistic Model”,文中用统计学上的泊松模型来比较单源和多源的概率,结果是更支持语言多源论。

但无论单源或多源,现在世界上约有六七千种语言,如何将它们组织起来并归类呢?著名语言学家Greenberg在语言谱系分类上就作出了有益的尝试。他的分类体包括12个大语系:克瓦桑语系、尼日尔-刚果语系、尼罗河-撒哈拉语系、德拉威语系、亚非语系、达罗毗荼语系、卡特维利语系、欧亚语系、得内-高加索语系(包括汉藏语)、南方语系、印度洋-太平洋语系、澳大利亚语系和美洲印第安语系。他认为,世界上为数众多的语言都是从这几大语系中发展出来的。而通过观察同一语系(如得内-高加索语)在世界范围内不同地域的分布,也能佐证这些区域的人存在亲缘关系。因此,语言和化石、基因一样,也是考察人类亲缘谱系关系的重要证据。

下面讨论一下欧亚语系中的印欧语及其分支的谱系研究。西方学界普遍认为现代语言学发轫于印欧语的历史比较研究。英国法官William Jones首次发现印度的梵语和他所熟知的欧洲诸语间存在诸多类似之处,因此断言这些语言同源。

其后,一代代学者继续沿着他的道路探索印欧语的亲属关系及传递过程。其中有两位德国语言学家August Schleicher和Johannes Schmidt相继提出了两大经典理论:前者首倡“时间-纵向传递-树形图理论”,后者则力主“空间-横向传递-波浪理论”。基于这些研究,我们可以从原始印欧语(Proto-Indo-European,简称PIE)中派生出来144种语言及彼此的亲缘关系。Gray 和Atkinson更进一步量化了欧洲诸语言的分化时间,其主要的量化依据就是词,因为亲属语言间往往具有共同的词汇、相近的形态及严整的语音对应规律。比如德国著名的语言学家Jacob Grimm就发现了三个有关印欧语辅音递变的现象,被称为“格林姆定律”(Grimm’s law),这三条规律能很好地勾勒出“原始印欧语(PIE)日耳曼语”的演变过程。

“人是何物”?我们在人类与其他动物沟通方式差异的比较中作出了最关键的回答“人是有语言的动物”、“语言是人类最重要的指标”,其后又讨论了语言的基本特征、语言的起源与谱系等相关问题。不过,知识总是在进步的,今日的理论,很可能明日就被新的发现或想法所取代,这一点是我们必须始终留意的。

(本文根据王士元先生的报告录音和PPT整理而成,内容有删改,题目与小标题为编者另加。华东师范大学思勉人文研究院博士张明辉整理。)

文章原载于社会科学报第1606期第5版,未经允许禁止转载,文中内容仅代表作者观点,不代表本报立场。

今日

关注

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180511A1IJRG00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

相关快讯

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券