首页
学习
活动
专区
工具
TVP
发布

乡音识别来了,你准备好了么?

少小离家老大回,乡音无改鬓毛衰。

儿童相见不相识,笑问客从何处来。

——贺知章《回乡偶书》

学生时期的我们都曾学习过这首诗。讲的是诗人青年时离乡老年才归还, 口音未变却已鬓发疏落容颜衰老。村童看见我却不能相认,笑着问我这客人是从何处而来。

提起这首诗,并不是为了回忆学生时代,而是让我们意识到,乡音在一个人心目中不可撼动的地位。乡音也就是我们常说的方言。方言是我们故乡情结的重要组成部分。其实故乡对漂泊在外的游子来说不仅仅是那明亮的月亮,不仅仅是熟悉的街道,不仅仅是巷道口的大树,更是弄堂的乡音。

随着时代发展和国家大力推行普通话,方言的应用范围越来越集中,越来越区域化,但仍有相当广泛的群体日常使用方言和以方言为主要沟通方式。放眼世界,每个国家都有自己的语言,同时也拥有不同语言下的方言。因而方言的应用,即对方言的语音识别,也是未来社会人工智能发展需要预估的一个方面。

智能机器人的语音识别功能,是需要创建模板,用来作为标准语音参数存放在计算机中。如果要将语音识别再转换为文字,例如微信的语音转文字功能,就要在计算器里存放好所有相对应的汉字的语音参数,同时还要分别区分男声和女声的数据库。对应不同的语音参数的同时也是训练机器人的过程。根据麦克风读取的待识别语音,转换成频域数据,再对比标准数据,选取参数中最为接近的作为识别结果再输出为文字,如汉字或其他文字。

而汉字较为复杂的是在于同音字的冗杂,中华文化博大精深,文字韵味也不逊色,但与此同时对于语音识别就大大增加了困难,例如我国著名语言学家赵元任先生的文章《施氏食狮史》,通篇就一个音,更是难以通过语音进行识别。

《施氏食狮史》 [shi]

石室诗士施氏,嗜狮,誓食十狮。施氏时时适市视狮,十时,适十狮适市。是时,适施氏适市,氏视是十狮,恃矢势,使是十狮逝世。氏拾十狮尸,适石室,石室湿,氏使侍试石室,石室试,氏始试食是十狮尸。食时,始识是十狮尸,实十石狮尸。试释是事。

当然这只是例外,但也说明了汉语的一个读音对应了多个汉字,要去分辨具体对应的是哪个汉字,只有通过上下对应的方式,和计算机中已经存储好的进行匹配,甚至除了上下文还要结合语义判断,这就更为复杂。普通话的识别就已经需要庞大的数据库支持,可何况各种方言,且彼此之间也几乎毫无联系大多为一个独立的语系。因此方言的识别任重而道远。

语音识别是人工智能的一个重要方面。人们语言语音复杂多变,不同国家、民族的人,说不同的国家和民族的语言。我们常听闻一个人可以掌握几种国家语言,对于正常人而言已经很了不起,那么对于方言呢?在人工智能上,我们也已设计出可以分辨多种语言的机器人,那是否可以更进一步,设计一个机器人能够听懂乡土的方言呢?毫无疑问目前这项任务是十分困难的。但是我们可以期待,也许不久的将来就会实现。

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171215G0MAS900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券