在长达2-3百万年的第四纪冰川时期,由于北半球的地表温度很低,人类的生存受到了很大的威胁。目前人类的一些大脑和躯体的功能特征可能是适应这一长期寒冷气候的结果。很多地区的岩洞为人类在寒冷气候下的生存起了重要的作用。然而,岩洞的混响(回音)声学条件也给人类听觉系统提出了巨大的挑战。

   在一个有混响的声学条件下,任何一个声源都可以引发大量的反射声源,而充斥着大量反射声波的环境对目标声源的觉察和辨认都有严重的影响。例如,在有一个多人说话和各种噪音的“鸡尾酒会”场景下,目标声源和其他掩蔽声源的空间分离有助于对目标声源的觉察和辨认,这是因为(1)空间分离可以提高一个耳朵中的声强信噪比(声学物理学去掩蔽效果),和(2)发自目标声源声波到达两耳的时间差不同于其他掩蔽声源到达两耳的时间差,进而能提升听觉神经元对目标声音的反应(神经生理学去掩蔽效果)。然而,在有混响的声学环境下,由于大量反射波的存在,上述的两种去掩蔽效果都被减弱或消除。有意思的是,尽管这两种去掩蔽效果不再存在,但言语目标声源与掩蔽声源的空间分离仍然能够促进对该目标言语的识别。因此,人类还有第三种空间分离去掩蔽的能力,而这种能力反映了史前人类长期对洞穴声学环境的适应。相应的机制是什么?

   声波是在时间坐标上展开的一维性信号。听觉系统对声音信号的时间动态特征有很强的加工能力,其中包括对两个或多个同时出现的声波进行相关性(即时间动态的相似性)计算的能力。在相关性计算的基础上,听觉系统也暴露了大脑的一种具有普遍意义的能力:在知觉层次上形成特征“捆绑”。具体来说,当两个高相关的声波(如来自同一声源的直达声波和一个反射声波)同时出现时,听觉系统在“觉察”到它们的高相关性之后就将它们进行知觉整合,并尽可能将这两个声波融合成一个听觉客体。这种“捆绑”能力很强,甚至可以从多个声波的混合体中将属于某个声源的成分在知觉层次上“挖出来”,以让其与在混合体外来自同一声源的相关成分进行整合。

   然而,实现这种知觉整合也要有一个前提。由于直达声和反射声之间永远有一个时间间隔,因而这种知觉整合是跨时间性的。本篇文章首次在题目中使用了“原始听觉记忆(primitive auditory memory, PAM)”这一名词。由于在心理加工层次上能将声波的精细结构信息充分地保持十几到二十几毫秒的原始听觉记忆的作用,提前进入听觉系统的直达声的精细结构信号能被完整或较为完整地维持在这一段时间内。而就在这段时间里,随后进入听觉系统的反射声的精细结构信号的中枢表达得以和直达声的中枢表达进行比较和相关性计算,这为随后的知觉整合提供了一个前提。

   在本项研究中,第一个实验检验在模拟混响条件下目标声源的直达声和模拟反射声之间的知觉整合的去掩蔽效果,重点考察当直达声和模拟反射声之间的时间距离发生改变时,这种知觉整合去掩蔽效果的动态特征,包括得到30个被试中每一位的动态特征的模拟方程的参数。有意思的是,尽管所邀请的30个大学生被试的听力全都很正常,但这些参数在他们之间有相当大的差异。由于这些参数反映了建立在知觉整合基础上的去掩蔽能力,被试之间这种能力的巨大差异是否有遗传学的原因?

   在本项目的第二个实验考察了这30个被试的原始听觉记忆的最大保持时间以及声音频率对原始听觉记忆保持的影响。结果发现,对低频声音的原始听觉记忆的保持要优于对高频声音的。而原始听觉记忆在这30个被试之间也存在着很大的差异。随后我们检验了这30个被试在知觉整合基础上的去掩蔽能力与原始听觉记忆的最大保持时间之间的相关性,发现对广谱噪音以及低频噪音而言,这种去掩蔽能力和原始听觉记忆能力之间有显著的相关性,即如果一个被试的原始听觉记忆越好,他(她)的知觉整合去掩蔽的能力就越高。因此,在听觉加工早期的精细声学结构的保持与对言语的空间去掩蔽过程之间有功能联系。

   因为知觉整合的一个极端效果是领先声和落后声之间完全的知觉融合,本项目的第三个实验比较了领先声和落后声之间知觉融合的时间间隔阈限和原始听觉记忆的最大保持时间。结果发现,当领先声和落后声之间的时间间隔已经充分地大而使得知觉融合不能形成时,原始听觉记忆还能出现。随后,第四个实验考察了原始听觉记忆随时间而衰退的时间动态特征,并发现这种衰退是一个加速过程,并可以用指数函数关系来模拟。

根据以上的结果,我们进而也提出了一个在嘈杂和有混响声学环境下的听觉加工链:即从快速衰退原始听觉记忆开始,到领先声音和落后声音之间的相关性计算,再到在相关性计算基础上的知觉整合,最后到在知觉整合基础上的对言语的去掩蔽。

   从实验研究报告的角度来看,这项研究是针对在嘈杂和有混响的声学环境下,人类所具有的除物理去掩蔽以及双耳加工去掩蔽之外的一种对目标声源认知的能力,但从理论思考上可以有以下几个方面的扩展:

1感知觉过程与记忆过程应当是一个机能整体(人们为研究方便硬是分化了不同的概念),感知觉的起步是原始感觉记忆。

2)本文所阐述的听觉加工链可能包含了与其他感觉系统相同或相似的加工原则。

3)处理复杂场景的信号是大脑的一个基本功能,能从动态和系统的角度来考察会有助于认识这个基本功能。

4)我们近期初步的研究结果也表明,精神分裂症病人的原始听觉记忆有显著的下降。有必要进一步研究这种严重精神疾病的认知缺失是否有在前注意加工阶段的源头。

5)原始听觉记忆对听觉老年化也敏感,而在听力和认知能力还处于医学诊断性正常的人群中的原始听觉记忆的明显下降是否与老年痴呆的早期机能缺失有关?

6)听力正常的年轻大学生在原始听觉记忆能力上的差异是否反映了遗传因素的作用?

 

Li, H.-H., Kong, L.-Z., Wu, X.-H., Li, L. (2013).Primitive auditory memory is correlated with spatial unmasking that is based on direct-reflection integration.PLOS ONE, 8 (4)e63106.