首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

关于年龄和听力损失对语言听觉分流影响的研究

本文为作者原创翻译,未经允许禁止转载

基于F0和声道长度差异的音节顺序性测定

1、理论基础

声道长度(VTL)和基频(F0)是体现说话者性别差异的两个声学特征。从均数看,男性的嗓音与女性嗓音存在差值,其差值比一个八度音的共振频率略低。本实验比较了YNH、ANH和AHI患者基于性别差异以及分别基于F0或VTL的差异来分流及传送语音的能力。

2、听众

本实验共测试了34名听众。其中包括10名YNH听众(4名男性,6名女性,年龄在19岁-30岁之间,年龄中位数22岁),7名ANH(4名男性,3名女性,年龄在46岁-73岁之间,年龄中位数为59岁),和17名AHI听众(9名男性,8名女性,年龄在42岁-77岁之间,年龄中位数为67岁)。

3、刺激与程序

本实验主要研究了语言自动分流,特别是F0、VTL和性别因素如何帮助将混乱的语音序列分离成不同的听觉流。本实验采用与前人相同的刺激方式,将CV语音串联成不同性别声音交替存在的序列,或者F0或VTL序列。实验1中使用的同一男性说话者的F0或有效VTL用Praat操纵,通过使(平坦的)F0增加3、5或9个半音,或者将有效VTL降低1.1、1.2或1.5的因子,导致原来男性声音的有效VTL比被操纵嗓音长110%、120%和150%。

参与者在一个时长为两小时的会话中完成三个任务,每个任务有三种条件下的操作。要求听众判断随机由两个不同的音节组成的“单词”(目标词)是否出现在下面的交错序列中。该单词在序列中的倒数第二位,序列的长度在12到20个标记之间随机变化。对于听力障碍患者,采用相同的方式并对发出声音进行修正半增益,将每个八度音的刺激放大到76dB HL。所有参与者从性别任务开始,两个任务(F0和VTL)的顺序无差异。测试了三个条件。在性别任务中,目标词总是由男性声音说话。在第一个条件(男性)中,只有一个序列被呈现(在语言序列中可能存在有静音间隙),并且要求听众检测目标词是否出现在这个男性语音中。第二个条件(男性/女性)下,交替使用男女声音,并指示听众只注意男性的声音,以检测目标词是否出现。在第三个条件下(男性/男性),这两个序列由男性声音组成。为了完成这项任务,听众必须识别目标词,该单词与来自同一说话者的其他音节交错在一起。对于性别任务,每位听者完成8组30个试验(3个条件下,有或没有目标词的5次重复)。每次试验后给予反馈。

在F0任务中,两个讲话者之间的F0差异为3, 5或9个半音的。在VTL任务中,两个序列的VTL相差110, 120和150%。随着VTL差异的增大,较高的语音(VTL越短)变得越不自然。听众被要求集中在较低的音调语音(F0任务)或更自然的语音(VTL 任务)上,以检测“目标词”是否出现在听到的语音中。对于F0和VTL任务,进行了30个试验的8个区块(有和没有目标词的3个条件的5次重复)。每次试验后,在屏幕上提供“正确”或“不正确”的反馈。

4、结果

性别任务在灵敏度D上的结果如图4所示。不同的色调对应于不同的条件,如图例所示,不同的柱形对应于不同的参与者组(YNH、ANH和AHI)。

性别任务的结果,如图4所示、以d表示其表现。所有三组都显示出较大的条件效应,黑色柱形(男性/男性),这两个序列由男性声音组成;灰色柱形(男性/女性)下,交替使用男女声音组成;白色柱形(男性)中,只有一个序列被呈现。

为了检验性别差异的影响,以条件(单序列、男/女、男/男)为被试内因子,以组(YNH、ANH、AHI)为被试间因子,对d'值进行重复测量,分析方差。方差分析显示病情[F(2,66)¼ 64.79; p

为了进一步研究年龄和听力损失的潜在影响,来自老年听众(ANH和AHI组)的数据被结合在多元线性回归分析中。首先,在单序列条件下研究年龄和听力损失的影响,以检查实验任务中的整体敏感性。结合听力损失(PTA为0.5、1、2和4kHz)和年龄的模型不能显著预测单序列状态下的表现[F(2,25)¼ 2.83; p ¼0.08; R 2 ¼0.197]。组合模型没有表现显著性,然而,部分方差可以用听力损失回归器来解释 (p¼ 0.04)。以听力损失为预测因子的简单线性回归 [F(1,25) ¼ 5.54; p¼ 0.003; R 2 ¼0.188],证实了这一结果。组合模型也不能预测男性/男性情况下的表现 [F(2,25)¼ 1.46; p¼ 0.25; R 2 ¼0.112]。相比之下,组合模型确实在男性/女性条件[F(2,25) ¼3.47; p¼ 0.048; R 2 ¼0.232]中占了很大比例,听力损失和年龄的p值分别为0.021和0.038。

考虑到对检测目标词的基本任务的敏感性依赖于听力损失,并且考虑到男性/男性条件中的平均表现处于或接近机会 (d'¼ 0),通过将男性/女性任务(d'mf)除以单序列的d',每个受试者在男性/女性任务中的表现(d'mf)被标准化。这样,如果听觉流分离完全成功(即女性交错序列的存在对听觉分流性能没有影响),则性能接近1,如果不可能分离,则性能接近0。这种流分离测量(男性/女性标准化的)经受多元线性回归,使用来自年龄和听力损失的ANH和AHI组的数据(PTA为0.5、1、2和4kHz)作为回归。回归分析表明,组合模型没有预测显著比例的方差[F(2,25) ¼0.41;p¼ 0.67; R 2 ¼ 0.035]。应该注意,结果并不取决于我们使用标准化d'值的决定;当使用单序列与男性/女性条件之间d'的差异时,得出相同的统计结论。

总之,在孤立的语音标记序列中检测目标词的能力受到听力损失的影响,但不受年龄的影响。然而,男性和女性语音分离的能力似乎没有受到年龄或听力损失的显著影响。这一结果可能是因为男性和女性语音在F0和VTL方面的差异足够大,以至于对听力损失的显著影响,导致听力损失的效果难以观察到。为检验T-S假说,分别研究了F0和VTL差异的影响。

5-1

5-2

图5得F0和VTL任务的灵敏度d'。图5-1对应于F0任务的灵敏度和图5-2对应于VTL任务的灵敏度。对于每个图,不同的柱形阴影对应于不同条件,并且每个柱形集合对应于不同的组(YNH,ANH和AHI)。平均误差符合±1标准误差。

在图5中显示出了作为F0和VTL函数的差值。结果在平均每个组的听众中,来自无差异(男性/男性,或0半音差异)和单序列的数据比较。为了确定F0差异对听觉性能的益处,对每个F0差异的个体d'值再次进行归一化,通过在单序列条件下将它们除以个体d'值。以这种方式,完全的听觉流分离(即相当于没有干扰声音的性能)将由接近1的分数来反映,而零的分数表示听觉流分离不存在。

以标准化d’值作为因变量,以F0(男性/男性,3,5和9个半音)作为被试内因子,以组(YNH,ANH和AH I)作为被试间因子,用方差分析评估F0的效果。结果表明,F0[F(3,99) ¼20.3; p

为了研究年龄和听力损失对老年参与者的影响,采用d′值的作为半音差(0、3、5和9个半音)的函数,以斜率测量听觉流。如果不能分离和/或如果序列之间的F0差异对性能没有影响,则函数的斜率将接近于零。另一方面,如果序列之间的F0差异增加导致听觉性能改善,那么斜率将是正的。使用该斜率度量,使用来自ANH和AHI组参与者的数据进行多元回归分析,回归系数为年龄和听力损失(PTA从0.5,1, 2,和4kHz)。与方差分析的结果一致,这个结合了年龄和听力损失的组合模型没有解释显著比例的方差 [F(2,25) ¼1.54; p¼ 0.23;R 2 ¼0.118]。YHN组和ANH组的平均斜率相似(分别为0.24和0.28),而AHI组的平均斜率较低(0.13)。

用方差分析评估VTL差异的影响,用标准化d’作为被试内因子,VTL条件(男性/男性,110,120和150%VTL)作为被试间因子,而组(YNH,ANH和AHI)作为被试间因子。结果表明,VTL条件[F(3,99) ¼ 26.0; p

使用标准化d值斜率的多元线性回归分析,更详细地分析了年龄和听力损失对基于VTL的流动的影响,评估为ANH和AHI组参与者的VTL差异(男性/男性,110,120和150% VTL)的函数。年龄和听力损失的回归(PTA之间的0.5,1,2,和4kHz)。分析表明,组合模型确实占了方差[F(2,25) ¼6.32; p ¼0.006; R 2 ¼0.355]的显著比例,并且这是由听力损失(p ¼0.003)而不是年龄(p¼ 0.27)驱动的。YHN组和AHI组的平均斜率相同(分别为0.31和0.34),而ANH组的平均斜率较浅(0.17)。

5、讨论

先前对NH听众的研究表明,句子之间的F0差异性可以增强句子的听觉流的分离。然而,Summers和Leek 发现听力损失的听众不能使用F0的差异来分辨句子差异性。在数据中发现,听力损失对听觉流的影响并不清楚;实际上,ANH听众的平均表现比AHI患者差。比较YNH组和ANH组可能表明年龄的影响;然而,尽管各组之间的年龄差异很大,但YNH组和AHI组之间的性能相似,这一结论令人怀疑。通过多元线性回归分析得出类似的结论,仅使用两个年龄较大的参与者组,这表明回归器(听力损失或年龄)均未显著预测其听觉性能。Summers和Leek 的研究是使用来自CMR语料库的句子进行的。因此,它们的刺激在时间和频率上重叠。因此,重叠可能解释了在他们的研究中听力障碍患者分流中的损失。

VTL中的差异也被发现用于提高NH听众的对于语句的可理解性。然而,人工耳蜗植入的用户对VTL差异不那么敏感,可能是由于较低的光谱分辨率和电流扩散引起的更大的通道相互作用导致。从VTL因素中获益的能力需要进入前两个共振峰。因此,只有在低频(250-1000赫兹)轻微损失的听众应该能够使用VTL因素。然而,对于听力损失更严重的听众来说,对VTL因素的使用应该受到损害。

正如引言中提到的,Mackersie等人在听力掩蔽言语存在的情况下,发现从中度到重度听力损失的听众在听懂言语时没有从VTL差异因素中获益。目前的研究结果显示年龄对于听觉流的显著影响(YNH和ANH听众之间的差异)。然而,与F0分析一样,AHI的表现与YNH组相似,尽管二者存在很大的年龄差异,这一事实使得这种解释也受到质疑。对性能斜率的多元线性回归分析表明,听力损失对VTL任务有一定的预测作用,但与直觉相反的是,听力损失越多,成绩越好。同样,这个结论可能是错误的,因为当比较YNH听众和AHI患者时,没有观察到听力损失的影响。

从这个实验中最令人惊讶和最可靠的发现是,听力损失并没有导致使用F0或VTL因素进行分离的能力降低。可能关键的因素是我们的研究只涉及顺序而不是同时呈现声音。在涉及竞争句子的条件下,声音在时间上重叠,潜在地导致一些直接掩蔽。为了测试这种可能性,迄今为止使用的范例被改变,使得来自两个序列的声音在时间上不同程度地重叠。该假设是,如果听力损失和/或老化通过直接掩蔽选择性地改变了条件,那么在序列在时间上最重叠的情况下,组间应该出现差异。

音节序列的时间重叠效应

1、理论基础

实验2的结果表明,听力损失的听众似乎能够使用F0和VTL因素来将连续呈现竞争性的声音分离,年轻和年长的NH听众呈现相同程度的能力。这个发现与早期的研究结果形成对比,早期的研究表明NH和听力障碍的听众在使用这些因素进行分辨讲话的能力方面存在差异,以及听力障碍的听众在复杂的听觉中常常遇到挑战。本实验测试这种差异是否可以归因于先前实验中竞争声音序列之间缺乏时间重叠。在系统改变两个序列之间的时间重叠量的情况下,测试了与先前实验相同的任务中的性能。

2、听众

10例YNH(男4例,女6例,年龄19~30岁,年龄中位数19岁),7例ANH(男4例,女3例,年龄46~73岁,年龄中位数59.5岁),17例AHI(男9例,女6例,年龄42~77岁,年龄中位数67岁)参加了本实验。3例YNH,5例ANH和17例AHI参与者参加了实验2。

3、刺激与程序

本实验使用与先前实验相同的刺激,每个序列中呈现160毫秒的令牌,起始间隔为400毫秒。每个听众参加两个小时的任务,第一个是训练任务,其中掩蔽者(女声)为3分贝。级别低于目标(男性声音),并且第二阶段是所有声音以相同的级别呈现的主要会话。使用与先前实验相同的刺激。与前一个听觉流式任务一样,由男性说话者讲的一个两个随机音节组成的词被呈现给听众,接着是1秒安静,然后是两个序列,一个由男性进行目标朗读,一个由女性干扰性朗读。

测试了五个条件:单序列(只有男性声音,在一个令牌每400毫秒的慢速率),0%重叠(交替的男女声音,在200 ms的时候出现间隔时间),50%重叠(男性声音领先女性声音80毫秒,并因此重叠)。50%重叠(女性声音领先男性声音80毫秒,并因此重叠50%),和100%重叠(男性和女性声音同时呈现,每一个声音之间的间隔间隔为400毫秒)。任务再次包括检测目标词是否呈现在男性声音中。40个试验的十五个区块(5个条件下,4个重复的有或没有字)与每个听众的反馈一起运行。

4、结果

图6如图例所示,结果灵敏度为d’。不同的颜色对应于不同的条件,每一组柱形组合对应于一组(YNH,ANH和AHI)。误差对应于平均值±1标准误差。

灵敏度(d′)的结果在图6中被给出。对d’值(通过除以在单序列条件下d’值来计算)在条件(0%、50%、?50%和100%的时间重叠)作为被试内因子和组(YNH、ANH和AH I)作为被试间因子,对病情有显著影响 [F(3,93) ¼ 19.42; p

由于具有重叠的条件彼此之间没有显著差异,因此在具有重叠的三个条件中估计每个参与者的d值的平均值。以年龄和听力损失(0.5、1、2和4kHz时的PTA)为回归因子,使用来自ANH和AHI组参与者的数据,进行多元线性回归,预测有重叠的条件的归一化平均d'值。该模型不考虑方差的显著比例 [F(2,23)¼ 1.92; p ¼0.17; R 2 ¼0.155]。

5、讨论

结果表明各组无明显影响。这一结果不支持我们的假设,特别是HI听众受到刺激之间的时间重叠的影响。事实上,这个实验表明HI听众能够利用目标和干扰之间的性别差异达到NH听众效果,一旦对CV的基本敏感性被考虑在内。无论重叠50%还是100%,性能都是相同的。此外,在+50%和 -50% 之间的性能没有差异。50%重叠条件,表明在目标辅音呈现没有重叠的条件(在50%重叠条件下)和目标元音呈现没有重叠的条件(在-50%重叠条件)。

6、一般性讨论

说话者之间的声学特征的差异可以提高一个说话者在另一个说话干扰时的可懂度。导致性别差异存在的两个主要因素是F0和VTL。已经证明,这两种因素都能够增强NH听众的听觉分流。值得注意的是,这些先前涉及运行语音的研究,在目标和干扰者之间发生了一些时间重叠。本研究的目的是研究年龄和听力损失对语音序列听觉流分离的影响,其中语言在时间上完全不重叠。

最初的CV识别任务表明,HI听众表现不佳,相比之下,NH听众,如预期估计。然而,意想不到的是发现HI听众能够使用F0和VTL的线索,在一个任务所需的语言交错的序列其分离性能提高。事实上,一旦表现出基本的识别标准,对HI组结果与NH组差异显著。这些结果表明,在复杂的声学环境下,相较于NH听众,HI听众不能用基本顺序听觉流分离能力,解释了这种差异。令人惊奇的是,发现序列的时间重叠,没有选择性地损害HI组的性能。结果似乎与以前的文献不同,从而发现HI听众使用F0差异分离竞争声音的能力降低。然而,不同的任务都是在现实语境语音识别和目标词检测在交替序列中进行,导致结果很难比较。

尽管研究结果表明基于F0和VTL差异的语音分离基本能力在HI听众中保持完整,但可能是我们的实验没有捕捉到日常生活环境中涉及感知分离的其他重要线索。例如,Strelcyk等人观察到在涉及数字序列的任务中,HI听众中的听觉流能力下降,其中目标和干扰者之间的声学差异是因为两个语音频谱倾斜的差异导致。

值得注意的是,这些结果还表明了不同听众组内和跨组之间差异很大。尽管在大多数情况下表现普遍,但在这里测试的关键条件中,听力损失和年龄都没有占显著比例的差异。这里发现的听力损失效果研究与使用更简单重复音调序列的流式研究的结果一致,尽管我们使用了更复杂和变化的语音。综上所述,这些结果表明,HI听众在日常听力环境中遇到的困难不能主要归因于基本听觉分流能力的缺陷。

为了防止我们走散,给我们加颗小星星吧

本文仅供分享,不代表耳鼻喉时空官方立场。希望大家理性判断,有针对性地应用。

征稿启示

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181102B08CRP00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券