报告人:Prof. Michael Landy

整理人:任祥娟

审核人:张航

  

  2019年12月24日下午1点,Michael Landy教授为学院老师和同学们带来了另外一场报告——The Hebbian Normalization Model。在本场讲座中,Landy教授组提出了一个基于赫布学习规则的区分-归一化模型,并将该模型用于解释V1神经元适应中的响应增益和偏好朝向的改变,以及神经元间响应乘积的内稳态。后续的行为和生理学实验印证了该模型的假设。

  

模式适应

  在我们的日常生活中,感觉系统常常表现出知觉适应。例如,当长时间观察一个略微逆时针倾斜的光栅后,我们会将一个垂直方向的光栅知觉为顺时针。出现这一现象的原因是神经元会根据刺激历史调整其自身的神经发放。

  在Benucci等(2013)的研究中,他们记录了猫在观察两种不同的刺激分布时V1神经元的发放情况。在均匀分布中,不同朝向的光栅等可能出现(图1A);而在有偏分布中,某个朝向光栅的出现频率远高于其他朝向(图1B中0 º为适应刺激);每个光栅呈现时间为32ms。结果显示,对有偏分布的适应改变了神经元的响应增益和调谐曲线:偏好0 º光栅附近的神经元,其响应被抑制,即响应增益下降;同时,这群神经元的偏好朝向会远离适应刺激,即发生调谐曲线的排斥移动(图1C)。

  

图1 A. 均匀分布。B. 有偏分布,其中0º为适应刺激。C.神经元适应后调谐曲线。摘自Westrick, Heeger & Landy (2016)。

  

  Benucci等的研究还发现,有偏分布中记录到的不同神经元神经发放的均值与无偏分布中记录到的模式类似(图2a和b),这意味着发生适应后神经元可以通过改变调谐曲线而维持内部稳态,以使神经发放与适应前相一致。除了维持神经元群体响应的均衡,适应还可维持神经元间响应的独立性。图3显示的是同时记录到的不同神经元对间的协方差矩阵:无论是在均匀分布还是有偏分布中,神经元间的最大相关出现在对角线上,即调谐曲线完全相同或者部分重合的神经元在刺激朝向改变时同时发放或者沉寂。

  

图2 适应维持群体神经响应平衡。a和d. 均匀分布和有偏分布条件下神经元的平均响应。b和d.使用均匀分布条件下拟合到的调谐曲线预测两种刺激分布条件下的群体神经元响应。c和f. 使用有偏分布分布条件下拟合到的调谐曲线预测两种刺激分布条件下的群体神经元响应。摘自Benucci, Saleem & Carandini (2013)。

  

图3 适应维持神经元间相关性的稳态。第一列:实验数据,无偏分布(a)和有偏分布(b)条件下神经元间响应的相关。第二列:使用无偏分布下得到的调谐曲线预测两种分布条件下神经元间响应的相关。第三列:使用有偏分布下得到的调谐曲线预测两种分布条件下神经元间响应的相关。摘自Benucci, Saleem & Carandini (2013)。

  

赫布归一化模型 (The Hebbian Normalization model)

  如何用一个统一的模型解释皮层适应后的所有现象呢?

  Landy教授的研究组提出了一个基于赫布学习规则的区分-归一化模型(Westrick et al., 2016),该模型可以动态地调整神经元之间的连接强度,从而维持神经元群体发放的内稳态。区分-归一化模型(divisive-normalization model)最初由Heeger等人提出,用于解释V1皮层中的各种神经生理学现象,包括交叉朝向抑制 (cross-orientation suppression) 和环绕抑制(surround suppression)。

  归一化神经响应定义为某个神经元前馈驱力(调谐曲线响应)的平方与该神经元群中其他所有神经元前馈驱力平方的加权和的比值。对于刺激朝向θ,神经元i响应的数学形式为:

(1)

  其中Ri为归一化神经响应(即发放频率);Fi(θ)Fj(θ)分别指代神经元 i j 的前馈驱力,其取决于神经元对应的调谐曲线(分别对应均值为θiθj高斯函数)和接收到的刺激;Wj,i为神经元 j i 抑制的权重;σ为半饱和常数。

  在区分-归一化模型的基础上,Landy教授组提出权重将通过赫布学习规则(Hebbian learning rule)进行更新。每对神经元 i j 之间的归一化权重将依据它们对刺激的响应而进行动态调整,从而使得两者的期望反应乘积能够尽可能地与内稳态目标值(Cj,i)接近:

(2)

其中α为学习率;RjRi代表两个神经元发放频率的乘积。

  但是,由于权重加在公式(1)的分母上,所以它引起的效应是反赫布学习的:如果神经元一起激活,(RjRi)将增大,权重的增加会引发Ri的减小。因此,Wj,i代表神经元 j i 的抑制程度。

  在公式(2)中,反应乘积的内稳态Cj,i并非自由参数,而是依赖于两个神经元调谐曲线的相似性。在Landy教授组的模型仿真中,Cj,i等于两个神经元对无偏刺激分布响应乘积的期望值:

(3)

  因此,在无偏分布中神经元间的归一化权重随时间稳定不变。在有偏分布中,高频出现的刺激引发对其偏好的神经元 i 以及调谐曲线与 i 临近的其他神经元 j 的响应,神经元之间反应乘积的增大势必引发归一化权重的增大(公式(2)),随之而来的效应是神经元 i 的归一化响应下降。这一学习规则保证了群体神经元响应的内部稳态特性。

  

赫布归一化模型仿真结果

  Landy教授组的模型仿真结果显示,赫布归一化模型可以成功预测神经元的适应后效应,包括神经响应增益降低,调谐曲线排斥移动,以及神经响应协方差的稳定维持。

  模型仿真结果如图4所示。在对0º刺激产生适应后,对0º刺激两侧朝向偏好(如-27º和+27º)的神经元对间的归一化权重增加,即两者的相互抑制增强。适应后,偏好 刺激神经元的响应增益随之减小(图4B和C)。与Benucci等人的生理学研究结果类似,调谐曲线增益的减小可以在很大程度上补偿有偏刺激分布引发的平均响应的不平衡(图4D虚线)。适应可导致朝向调谐曲线发生排斥移动(图4E),且偏移值的大小随与适应刺激差值的增大呈现出先增加后下降的模式(图4F)。此外,协方差矩阵表现出内稳态模式(图4I)。

  

图4 赫布归一化模型的仿真结果。A.对 朝向发生适应后神经元间的归一化权重。B.适应后神经元调谐曲线。C.适应后神经元响应增益曲线。D.适应前(黑色实线)和适应后(黑色虚线)平均神经响应。E.适应前(实线)和适应后(虚线)两个神经元的调谐曲线。F.调谐曲线的排斥移动。G.均匀分布条件下的神经响应协方差。H.适应前有偏分布条件下的神经响应协方差。I.适应后有偏分布条件下的神经响应协方差。摘自Westrick, Heeger & Landy (2016)。

  

备选模型及仿真结果

  除了赫布归一化模型,Landy教授组还测试了另外三个备选模型。第一个备选模型是协方差内稳态控制模型(Homeostatic control of covariance),其学习规则是根据目标协方差调整归一化权重,从而维持每对神经元的响应协方差。第二个备选模型是单层前馈增益改变模型(Single-layer feedforward gain-change model),该模型假设每个神经元的权重通过delta规则进行学习,该模型将传统的增益适应和归一化假设相结合,但仅有这两个假设无法预测调谐曲线的排斥移动。第三个备选模型是两层前馈增益改变模型(Two-layer feedforward gain-change model),该模型并无任何归一化假设,其定义输出层神经元的响应(Rioutput)为输入层神经元(Riinput)朝向调谐响应的加权总和,每层神经元的权重同样通过delta规则进行学习。

  备选模型的仿真结果显示,两层前馈增益改变模型能够预测真实数据中观测到的适应后神经响应增益下降、调谐曲线排斥移动以及协方差内稳态。但在量级上,其与真实数据相差很远。

  

赫布归一化模型与有效编码的关系

  之前的研究者认为适应与神经元的去相关反应有关。基于有效编码理论,当皮层神经元接受到有偏刺激分布时,更多的神经元将被用于表征频率更高的刺激,并且这些神经元有更窄的调谐曲线,由此带来的结果是调谐曲线吸引。

  但Landy教授认为在不同神经元的调谐曲线相互重合的前提下,去相关是不现实的。他认为,适应的目的是稳定神经元响应间的统计独立性,即稳定神经响应间的预期乘积(expected product)。Landy教授组使用有效编码理论进行仿真的结果证实了对有偏刺激分布进行有效编码的神经元群处于反应乘积稳态。Landy教授也提到,赫布标准化模型是否等同于有效编码的一种特定实现形式还有待商榷,因为这取决于噪音的形式、需要优化的损失函数形式(比如最大化刺激和神经响应间的互信息,或者最小化预测刺激和真实刺激间的均方差)和其他约束条件(比如有限的神经发放)。此外,短期适应(赫布学习)使用的可能是不同于长期可塑性(有效编码)的神经机制。

  

生理和行为学证据

  Landy教授通过以下三个实验为赫布归一化模型中的反赫布学习规则提供了实证证据。

  实验一使用交叉方向抑制范式。在适应阶段,每屏刺激中注视点左右两侧(距离中央注视点3º)将呈现两个朝向相同的光栅。被试将体验两种不同的适应条件:在asynchronous adapter中,连续两屏刺激中的光栅朝向将以5Hz的速率在+15º和-15º(另外一种条件是+45º和-45º)间进行切换(图5左第一行);在contingent adapter中,两种朝向的光栅(±15º或±45º)将同时呈现,彼此交错而形成格纹图案,该格纹图案将与一个灰色空屏以5Hz的频率交替呈现(图5左第二行)。在测试阶段,目标光栅将随机叠加到注视点两侧出现的与其朝向相反的掩蔽光栅上(图5左第三行)。被试的任务是选出目标光栅所在的位置。由于两个朝向相反的光栅同时呈现将分别激活两组神经元群,根据赫布归一化模型,在contingent adapter中,神经元之间的互抑制增强。

  实验二使用环绕抑制范式。Contingent adapter中刺激包含两种类型:相反朝向对(中心和环绕光栅的朝向相反)和相同朝向对(中心和环绕光栅的朝向相同)(图5右第一行)。对于每个被试,两类光栅的左右位置固定不变。在适应阶段,刺激以5Hz的速率进行切换。在测试阶段,每个试次中注视点两侧的contingent adapter类型相同(同为相反朝向或者同为相同朝向),其中一个位置的刺激被随机选为标准刺激,其中心光栅的对比度固定不变;另外一个位置的刺激被称为比较刺激,其中心光栅的对比度在试次间变化。被试的任务是比较左右两个位置中心光栅的对比度大小(图5右二三行)。如果同一位置对应的适应刺激和比较刺激相同,则两者匹配,根据赫布归一化模型,环绕抑制增强,这将降低测试刺激中心光栅的对比度;而如果适应前后刺激不同,则两者不匹配。

  

   

图5 交叉方向抑制实验(左)和环绕抑制实验(右)范式。摘自Yiltiz, Heeger & Landy (Yiltiz, Heeger, & Landy, 2020)。

  

  实验结果与模型预测一致:相比于asynchronous adapter(实验一)和适应-比较刺激不匹配条件(实验二),当调谐曲线不同的两组神经元被同时激活时,两者互抑制增加,检测阈值(实验一虚线和三角)或者主观相等点(实验二实线和圆圈)增高(图6)。

  

图6 交叉方向抑制实验(左)和环绕抑制实验(右)实验结果。摘自Yiltiz, Heeger & Landy (Yiltiz et al., 2020)。

  

  在研究三中,Landy教授组与其合作者通过恒河猴V1神经元的胞外记录数据证明了归一化产生的抑制可以通过适应而增强。该研究分为三个部分:前适应阶段,适应阶段和后适应阶段(图7C)。适应阶段有两种条件——contingent adaptation和asynchronous adaptation(图7B),测试阶段(前适应和后适应)的刺激如图7A所示。其中,对于每个神经元,将目标刺激定义为在50%对比度条件下可引发更强神经响应的光栅,另外一个朝向的光栅为掩蔽刺激。

  

图7 实验三实验刺激(图A和B)和流程(图C)。摘自Aschner et al. (2018)。

  

  结果显示,两种适应条件下,掩蔽刺激均会降低神经元对目标刺激的响应(图8A和B)。在接下来的分析中,Landy教授组使用掩蔽指数(MI)来量化掩蔽的强度,该指数等价于掩蔽刺激对目标刺激的归一化强度:当MI=1,掩蔽效应最强,即归一化强度为1;当MI=0,代表掩蔽效应最弱,归一化强度为0。结果显示,在适应后,contingent adaptation会增强掩蔽刺激对目标刺激的抑制效应(图9A和B绿线),而asynchronous adaptation则会削弱掩蔽(图9A和B蓝线)。该结果证明,掩蔽刺激对目标刺激的抑制作用可通过持续地呈现目标-掩蔽对来增强(contingent adaptation),也可以通过间断地呈现目标-掩蔽刺激对来减弱(asynchronous adaptation)。此外,当测试刺激和适应刺激的朝向不同时,两种条件下的效应均会减弱(图9C和D)。

  

图8 适应前和适应后神经元对刺激的响应曲线。摘自Aschner et al. (2018)。

 

图9 适应前后掩蔽刺激对目标刺激的归一化强度。摘自Aschner et al. (2018)。

  

总结

  综上所述,Michael Landy教授组的研究证明基于赫布学习规则的区分-归一化模型可用于解释皮层适应的多种现象。在该模型中,神经元间连接的权重会根据神经元间的响应而发生动态调整,从而维持神经元群体响应乘积的稳定。模型仿真的结果与现有的生理数据一致,包括响应增益下降,调谐曲线的排斥移动,以及响应协方差的内稳态维持。此外,Landy教授组还使用了偶然适应范式印证了行为和生理实验的结果符合该模型的预期。

  

参考文献

Aschner, A., Solomon, S. G., Landy, M. S., Heeger, D. J., & Kohn, A. (2018). Temporal contingencies determine whether adaptation strengthens or weakens normalization. The Journal of Neuroscience, 38(47), 10129-10142.

Benucci, A., Saleem, A. B., & Carandini, M. (2013). Adaptation maintains population homeostasis in primary visual cortex. Nature Neuroscience, 16(6), 724-729.

Westrick, Z. M., Heeger, D. J., & Landy, M. S. (2016). Pattern adaptation and normalization reweighting. The Journal of Neuroscience, 36(38), 9805-9816.

Yiltiz, H., Heeger, D. J., & Landy, M. S. (2020). Contigent adaptation in masking and surround suppression. Vision Research, 166, 72-80.