前言:中文期刊网精心挑选了神经网络中的注意力机制范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
神经网络中的注意力机制范文1
摘要:自适应共振模型是为了能够分类任意次序模拟输入模式而设计的,它可以按任意精度对输入的模拟观察矢量进行分类,较好地解决了前稳定性和灵活性问题,同时能够避免对网络先前所学的学习模式修改。本文将ART2模型应用于信用风险评估,通过实证比较研究,结果显示应用自适应共振模型进行信用风险评估在精度和准确性上,都优于其他神经网络模型和统计方法。
1统计方法用于信用风险分类评估存在的局限性
对信用风险评估一类主流方法是基于分类的方法,即把信用风险分析看成是模式识别中的一类分类问题—将企业划分为能够按期还本付息和违约两类。其具体做法是根据历史上每个类别(如期还本付息、违约)的若干样本,从已知的数据中发现其规律,从而总结出分类的规则,建立判别模型,用于对新样本的判别,这样信用评估就转化为统计中的分类问题。传统的统计模型主要基于多元统计分析方法,根据判别函数的形式和样本分布的假定不同,主要的模型有:多元回归分析模型、多元判别分析模型(MDA)、Logit分析模型、近邻法等。其中以多元判别分析模型和Logit分析模型应用最为广泛,已有大量商业化软件。
尽管这些方法在国外有大量应用,但是大量实证研究(Altman,1983;Tam & Kiang,1992;Altman,et al,1994)结果发现:(1)企业财务状况的评价可以看作是一类基于一系列独立变量基础上的分类问题;(2)企业财务状况好坏与
财务比率的关系常常是非线性的;(3)预测变量(财务比率)可能是高度相关的;(4)大量实证结果表明,许多指标不成正态分布。而统计的方法却不能很好地解决以上问题。由此可见统计模型的最大优点在于其具有明显的解释性,存在的缺陷是过于严格的前提条件。如多元判别分析模型(MDA),它要求数据服从多元正态分布、等协方差、已知先验概率和误判代价等要求,而现实中大量数据严重违背了这些假定(Eisenbeis,1997)。引入对数变化可在一定程度上改进数据的非正态分布,但一方面变换后的变量可能失去经济解释含义,另一方面仍没有满足等协方差的要求;应用二次差别分析(QDA)虽可解决等协方差问题,但一方面没有满足正态性假设,另一方面当数据样本小、维数高(指标多)时二次差别分析的性能明显下降,而样本少、维数高正是我国信用数据的显著特点。实证结果还表明二次差别分析对训练样本效果较好,而对测试样本并不理想。除此以外,多元判别分析模型适用于成熟行业的大中型企业,因为这些企业具有较强的稳定性和规范性,其发展有一定的规律可循,参数统计方法易于给出较准确的结果及合理的解释。然而这类方法是静态的,需要根据地区、行业经济情况的变化不断地调整参数,甚至进行变量的调整。
为了解决这些问题,引入了Logit分析模型和近邻法。Logit分析模型不需要假定任何概率分布,也不要求等协方差,但是当样本点存在完全分离时,模型参数的最大似然估计可能不存在,模型的有效性值得怀疑,另外该方法对中心区域的差别敏感性较强,导致判别结构的不稳定。近邻法不要求数据正态分布,但当数据的维数较高时,存在所谓的“维数祸根(Curse of dimensionality)”——对高维数据,即使样本量很大,其撒在高维空间中仍显得非常稀疏,绝大多数点附近根本没有样本点,这就使得“利用空间中每一附近的样本点来构造估计”的近邻法很难使用[4]。
2应用神经网络进行信用风险评估的意义
商业银行信用风险评估是复杂的过程,除了对企业的财务状况的各种特征的评估外,还须对企业的非财务状况进行评估,而且又涉及宏观经济环境和产业结构、产业周期的影响;除了客观的评估外,还依赖于专业人员依据经验进行主观评估。神经网络是一种具有模式识别能力,自组织,自适应,自学习特点的计算机制,它的知识编码于整个权值网络,呈分布式存储且具有一定容错能力。神经网络对数据的分布要求不严格,也不必要详细表述自变量与因变量之间的函数关系,神经网络的这些特征使之成为信用风险分析方法的一个热点。
建立商业银行信用风险评估模型必须依赖于一组已知的函数集合。要求这种函数集合在任意精度上可以逼近实际系统,从数学上讲,这就要求这个集合在连续函数空间上是致密的。目前已经从理论上严格证明了只用一个隐藏层的神经网络就可以唯一地逼进任何一个连续函数。多层神经网络为系统的辨识和建模,尤其是非线性动态映射系统提供了一条十分有效的途径。非线性动态映射系统的神经网络建模被认为是应用神经网络的最成功的范例。
影响商业银行信用风险评估的机理很复杂,无法建立精确的非线性动态模型,而人工神经网络擅长处理非线性的、关系不确定的十分复杂以至于数学模型难以描述的问题。对于分析时间序列数据,由于人工神经网络能识别和模拟数据间的非线性关系,不需要正态分布和先验概率等条件的约束,能针对新增样本灵活的训练再学习,因此优于其他统计方法,同时由于网络本身具有自学习的功能,预测结果相对精度较高而且稳定性好,因此应用神经网络可以通过对网络的训练,掌握借款人的财务特征的非线性函数关系。神经网络是由许多神经元构成的,它对系统特性的记忆表现为各个神经元之间的连接权值,单个神经元在整个系统中起不到决定性作用,一个经过训练的神经网络可以按相似的输入模式产生相似的输出模式,当商业银行信用风险评估系统因某些非财务风险因素和判断误差过大的财务风险因素造成输入模式变形时,网络仍可以保证稳定的输出。
神经网络可以逼进任意复杂的非线性系统,神经网络的转换函数能够非线性地响应冲击,例如,像覆盖比率这样的财务比率超过最低水平(如AAA级)时,超过这个阀值的增加值不会对信用质量有什么影响。线性回归不能以这样的方式限制响应程度,神经网络的转换函数却能实现。神经网络以并行的方式处理信息,具有很强的信息综合能力,因此神经网络理论在商业银行信用风险分析和实施对信用风险的主动控制中将会发挥更大的作用。
由神经网络构成的非线性模型具有较强的环境适应能力。在根据多个训练样本企业的财务特征建立神经网络非线性系统后,如果企业类型、财务特征和非财务特征发生变化,神经网络可以通过学习,建立企业信用的非线性函数关系,并且不需要改变网络的结构和算法。
综上所述,对于那些无法建立精确的动态判别函数模型的非线性商业银行信用风险评估,可以将神经网络理论应用于风险评估当中,撇开企业财务因素、非财务因素和企业信用状况复杂的非线性机理,建立起非线性风险映射近似的动态模型,使这个模型尽可能精确地反映风险映射关系非线性动态特征。通过该系统我们能够计算对各种输入的响应,预估商业银行信用风险状况及其发展趋势,进而能够使用各种信用工具对风险进行主动控制,促进商业银行的智能化风险管理系统的建设和发展完善。
3基于自适应共振理论的信用风险评估模型
一个公司财务状况的好坏往往是企业自身、投资者和债权人关注的焦点。因为一个营运良好、财务健康的公司可提高自身在市场上的信誉及扩展筹资渠道,以使投资者信心倍增。相反,一个陷入财务困境和濒临破产的企业不仅乏力吸引投资,还让原有投资者面临巨大的信用风险。
由上文的分析中我们知道,对企业财务指标的分析,传统的分类方法尽管有它的优点但本身也存在一些局限性。作为研究复杂系统的有力工具,神经网络能处理任意类型数据,这是许多传统方法无法比拟的。通过不断学习,能够从未知模式的大量复杂数据中发现其规律。神经网络方法克服了传统分析过程的复杂性及选择适当模型函数形式的困难,它是一种自然的非线性建模过程,毋需分清存在何种非线性关系,给建模与分析带来极大的方便。该方法用于企业财务状况研究时,一方面利用其映射能力,另一方面利用其泛化能力,即在经过一定数量的带有噪声的样本训练之后,网络可以抽取样本所隐含的特征关系,并对新情况下的数据进行内插和外推以推断其属性。
目前我国银行机构主要使用计算贷款风险度的方法进行信用风险评估——在对企业进行信用等级评定的基础上,考虑贷款方式、期限以及形式因素,进而确定贷款的风险度。其中作为核心的信用等级评定,是通过对企业的某些单一财务指标进行评价,而后加权平均确定的。该方法的最大缺陷在于指标和权重的确定带有很大的主观性,使得评级结果与企业的实际信用状况有很大出入,因此需要引入科学方法来确定有效指标,并建立准确的定量模型来解决信用评估问题。
针对这种形势,根据我国商业银行的具体情况,结合国际上目前较为流行人工神经网络技术,本文设计了一种基于自适应共振理论的信用风险评估方法。
3.1自适应共振理论(ART)介绍
自适应共振理论(Adaptive Resonance Theory)简称ART,是于1976年由美国Boston大学S. Grossberg提出来的。他多年来一直潜心于研究用数学来描述人的心理和认知活动,试图为人类的心理和认知活动建立统一的数学理论,ART就是这一理论核心部分,又经过了多年的研究和不断发展,至今已经提出了ART1、ART2和ART3共三种结构。ART网络作为模式分类器较好地解决了前面提到的稳定性和灵活性问题。使用ART网络及算法具有较大的灵活性以适应新输入的模式,同时能够避免对网络先前所学的学习模式修改。ART是一种能自组织的产生对环境认识编码的神经网络理论模型,由于横向抑制是自组织网络的特性,ART采用了MAXNET子网结构,该网络采用横向抑制方法增强并能选择具有最大值输出的一个节点。
ART模型的算法过程如下:
第一, 将一个新样本X置入节点;
第二,采用自下而上的过程,求得: ;
第三,运用MAXNET网络,找到具有最大输出值的节点;
第四, 通过自上而下的检验,判断X是否属于第j类,即如果有 ,则X属于第j类, 是警戒参数。如果上式不成立,转到第六步,否则继续。
第五, 对于特定的j和所有的i更新 和 ,设t+1时刻 , , , 。
第六, 无法判断X是否属于第j类,抑制该节点返回到第二步,执行另一个聚类的处理过程。
本文所使用的神经网络模型就是ART2神经网络模型。ART2神经网络是为了能够分类任意次序模拟输入模式而设计的。它可以按任意精度对输入的模拟观察矢量进行分类。
3.2应用ART2神经网络进行信用风险评估的可行性分析
通过上文对ART2神经网络的介绍,笔者认为将ART2神经网络应用于信用风险评估具有统计方法和其他神经网络算法无法比拟的优势。首先,ART2神经网络较好地解决了稳定性和灵活性问题,它可以在接受新模式的同时对旧模式也同样保持记忆,而其它类型神经网络所记忆的样本个数有限,由此可见,ART2神经网络随着输入样本数的增加,它作为模式分类器分类的精度也越高,所覆盖的样本空间也越大。其次,ART2神经网络是边学习边运行的无监督学习,所以它不存在像BP算法那样需要进行几小时甚至更长时间的训练过程,也就是说ART2网络具有较高的运行效率和较快的学习速率,这一点对于解决像信用风险评估这样的复杂问题来说是相当具有优势的。再次,ART2神经网络与人脑的某些功能类似,能够完成识别、补充和撤销的任务。这三种功能在英文中称为Recognition,Reinforcement和Recall,可简称为3R功能。识别功能在上文已经介绍过,下面对补充、撤销功能做些简单介绍。补充功能包含有以下几方面的内容:(1)每当ART2系统对输入矢量的类别作一次判决即是给出矢量所属类别的输出端编号,根据此判决,系统可以采取一种“行动”或者作出某种“响应”。这和人总是根据对外界情况的判断来决定自己的行动相似。(2)人在识别时对于所有被识别的类并不是一视同仁的,识别过程受到由上向下预期模式的很强制约。这样就会使得人们在某些情况下只关心几种类别,而对其他类别则“不闻不见”,这种集中注意力的本领可以使人们在混乱的背景中发现目标。在客体发生某种变形或缺损或者有强噪声情况仍能对其正确分类。我国商业银行进行信用风险分析的起步较晚,有关的信息往往残缺不全,ART2网络的这种在混乱中集中注意力发现目标的功能更适合我国的现实数据情况。撤消功能的作用与补充功能相反,这是指某些不同的观察矢量在初步分类时被划分成不同的类别,但是通过系统(主体)与客体相互作用的结果,又应判定它们属于同一类。由此可见基于ART2网络的这些功能,应用ART2神经网络进行信用风险评估相当于人类专家进行信用风险评估的建模过程,而且ART2神经网络与人类专家相比进行的评估更客观、更有效、更精确。最后,ART2神经网络可通过调整警戒线参数 (门限值)来调整模式的类数, 小,模式的类别少(对分类要求粗), 大,模式的类别多(对分类的要求精细),这一点是其他方法无法比拟的,我们可以通过调整 值对输入网络的财务数据进行传统的两级分类(即违约、非违约两类),也可以通过提高 值对输入网络的财务数据进行国际通用的五级分类(即正常、关注、次级、可疑,损失五类)。Altman、Marco和Varetto与意大利银行联合会合作在其经济和金融信息系统中首次进行了将神经网络应用于企业的经济和金融问题诊断的试验,试验的研究结果表明,将企业的财务状况分为正常、关注和次级三类比分为正常和问题两类困难得多,而ART2神经网络却可以通过 值的调整灵活地实现该功能。
综上所述,笔者选择算法复杂的ART2神经网络进行信用风险评估。并且设计了一个自适应共振网络,对信用风险分析进行了实证研究。
3.3基于ART2模型的信用风险分析的实证研究
下面以某国有商业银行提供的90多家企业客户为对象,应用自适应共振理论对这些企业客户的财务数据进行信用风险评估。对于输入到神经网络的财务比率的选择,参照国内财政部考核企业财务状况及国外用于信用风险评估所使用的一些经典财务比率指标,一共挑选出包括企业盈利能力、企业营运效率、企业偿债能力及企业现金流量状况等二十余个指标,考虑到指标间的相关性,利用SAS统计分析软件进行回归分析,得出以下几个比率:
经营现金流量/资产总额(流动性)
保留盈余/资产总额 (增长性)
息税前利润/资产总额 (赢利性)
资产总额/ 总负债 (偿债性)
销售收入/资产总额 (速动性)
某国有商业银行提供的样本数据有90多家企业的财务数据,数据质量不高,有些企业财务数据缺失严重,经过对样本数据的初步审查,删除了不合格的样本40多个,最终得到有效的样本为55个,其中能够偿还贷款的企业34个,不能偿还贷款的企业21个。
评估的准确程度用两类错误来度量,在统计学中,第一类错误称为“拒真”,第二类错误称为“纳伪”。在信用风险评估中把第一类错误定义为把不能偿还贷款的企业误判为能偿还贷款的企业的错误,第二类错误定义为把能够偿还贷款的企业误判为不能偿还贷款的企业的错误。显然,第一类错误比第二类错误严重得多,犯第二类错误至多是损失一笔利息收入,而犯第一类错误则会造成贷款不能收回,形成呆帐。
在应用自适应共振模型进行信用风险评估的同时,笔者也使用了统计方法和经典的BP神经网络模型对同样的样本数据进行了信用风险评估,以便比较验证自适应共振模型的评估准确性。
统计方法使用的是可变类平均法,可变类平均法是由Lance和 Williams(1967)发展的,计算距离的组合公式为:
Djm=(Djk+DjL)(1-b)/2+DkLb (1)
参数b介于0到-1之间,DkL——是类Ck与CL之间的距离或非相似测度。笔者使用SAS统计软件中提供的可变类平均法对样本数据进行了聚类分析。
BP神经网络的结构包括输入层5个节点,用来输入5个财务指标比率,输出层1个节点(取值为1表示能偿还贷款,取值为0表示不能偿还贷款),另外还有一个隐层,隐层包括5个隐节点。网络的有效性采用K组交叉检验的方法进行验证,也就是将样本分为K组,其中K-1组为训练数据,第K组为检验数据,这里将样本数据分为两组,第一组用于训练网络,包括11个违约的企业和16个非违约的企业,第二组作为检验数据,包括10个违约企业,18个非违约企业。该方法使用MATLAB语言编程实现。
ART2模型包括输入层为5个节点,用来输入5个财务指标比率,输出层3个节点,分别表示信用风险的三个级别(正常,关注,可疑),这里应用ART2模型将信用风险分为三个级别有如下几个原因:(1)将信用风险分为三个级别,比前面使用统计方法和BP模型方法将信用风险简单分成两类(违约、非违约)更容易把握风险的程度,更接近实际信用风险评估的需要,也更贴近于国际通用的五级分类标准。(2)通过ART2网络门限值参数的调整可以将信用风险分为国际通用的五级分类标准,这也正是ART2模型的优势所在,但是ART2网络是信用风险分析混合专家系统的组成部分,它的评估结果要作为输入,输入到专家系统中,以便信用风险评估专家系统进行定性及定量的综合评估,考虑到专家系统的规则的数量和知识库的规模对系统执行效率的影响,因此这里将信用风险分为三类。有关专家系统的详细说明,将在下一节讨论。下面给出ART2模型网络的参数设置:a=10,b=10,c=0.1,d=0.9, =0.2, 。由于ART2模型是无教师指导的网络,因此不用训练,直接输入数据,网络自动进行信用风险评估。其中评估的结果:正常、关注两类属于非违约企业,可疑为违约企业。该方法使用C语言编程实现。
下面给出三种方法的最后评估结果见表1
表1 训练样本和测试样本的误判
训练样本 测试样本
第一类错误 第二类错误 总误判 第一类错误 第二类错误 总误判
统计模型 8(38.01%) 9(26.5%) 17(30.9%)
BP模型 2(18.1%) 1(6.1%) 3(11.1%) 3(30.0%) 4(22.2%) 7(25.0%)
ART2模型 4(19.1%) 5(14.7%) 9(16.3%)
通过表1的比较结果可以看出对于统计方法和BP模型自适应共振模型的误判率是最低的,说明了该方法的有效性和可靠性。
另外需要说明的一点是,这里所使用的企业样本数据偏少,而且噪声过多,数据的质量不是很好,这样的数据作为初始数据输入网络对网络的评估的准确性有一定的影响,虽然ART2这种集中注意力可以在混乱的背景中发现目标的特性使得它的评估的准确性比其它两种方法要高,但是笔者相信如果初始输入网络的数据质量再提高一些,网络的误判率会更低。
参考文献:
[1] 张维,李玉霜,商业银行信用风险分析综述,《管理科学学报》[J],1998年第3期,20-27。
[2] 朱明,杨保安,基于知识的银行贷款分类系统,CJCAI2001[C],231-235。
[3] 黄娟,冯玉强,王洪伟,基于联接归纳推理的信贷风险评估集成智能系统,《计算机应用研究》[J],1999年第9期,74-16。
[4] 王春峰,万海晖,张维,商业银行信用风险评估及其实证研究,《管理科学学报》[J],1998年第1期,68-72。
[5](美)约翰.B.考埃特,爱德华.I.爱特曼,保罗.纳拉亚南著,石晓军等译,《演进着的信用风险管理》[M],机械工业出版社,2001。
[6] 李志辉,《现代信用风险量化度量和管理研究》[M],中国金融出版社,2001年。
[7] R.R.Trippi and E.Turban, Neural networks in finance and investing[M], chicago: Irwin professional publishing,1996。
[8] Dick San-Cheong cheung, Kwok-Wa Lam and Sheung-Lun Hung, neural networks for credit scoring model, intrlligent data engineering and learning perspectives on financial engineering and data mining[M], published by Springer,1998,55-62。
神经网络中的注意力机制范文2
论文摘要:本文在分析国外在信贷风险评估方法上创新、应用及其发展趋势的基础上,结合内部评级的国际经验,分析了我国商业银行在信用风险管理方式、控制手段和管理框架上的不足,提出了建立内部评级体系的一系列措施,以期为我国金融机构信贷风险管理提供一些有益的参考。
一、信用评级相关研究成果综述
(一)财务指标变量预测企业经营危机的起源最早运用单一财务指标变量预测企业经营危机的研究,始于1930年代的Smith&Winker(1930、1935)。Fitzpatrick(1932)进行单变量破产预测研究,选择了19家公司作为样本,运用单个财务比率指标将样本划分为破产和非破产两组,发现判别能力最高的是净利润,股东权益和股东权益,负债两个比率。1966年由威廉,比弗(WilliamBeaver)沿着该思路继续研究。Beaver(1966)应用统计方法研究1954~1964年期间的79家失败企业,并以单变量分析法建立财务危机预测模型。发现有些财务比率在两组公司间确有显著不同,其中“现金流量,负债总额”是预测经营失败的最佳指标,其次为“资产负债率”以及“资产报酬率”。笔者认为,Beaver用单一的财务指标变量来判别企业的违约概率这样的复杂层面分类存在问题,因为企业违约概率的影响因素是多层面,仅用一个指标来判断未免偏颇。
(二)多元线性判别分析模型典型的代表是美国的爱德华·阿尔特曼博士(Edward Airman)著名的Z-score模型和ZETA信用风险模型。多元线性判别分析模型是研究对象所属类别进行判别的一种统计分析方法,该方法是从若干表明观测对象特征的变量值(财务比率)中筛选出能提供较多信息的变量并建立判别函数,使推导出的判别函数对观测样本分类时的错判率最小。Airman(1968)是率先将多变量分析用于预测财务困境公司,提出了著名的z一8COle模型。其过程包括各种可选函数(包括每个自由变量的相对贡献的判决)的统计显著性的观测;相关变量的相关关系评价;各种变量组合预测精度的观测;专家的意见。作者早在1968年对美国破产和非破产生产企业进行观察,采用了22个财务比率经过数理统计筛选建立了著名的5变量Z-score模型,最后选出了最具解释力的5个财务指标,分别是营运资金/总负债、保留利润/总资产、息税前利润/总资产、权益市价/总负债、销售收入/总资产财务比率。根据比率对借款还本付息的影响程度确定变量权重,最后将每一个比率乘以相应权重后相加,最后结合成一个线性模型,被定名为z-score模型。1977年Altman对此模型进行了修正和扩展,建立了ZETA信用风险模型,模型变量由5个变为7个。对于此种不同期间导致模型的差异,Altman认为是由于企业环境的改变而需要使用不同的财务变量,且财务预警模型也可能因使用不同期间的财务报表而有差异。
(三)多元回归模型来判别企业违约的代表Horrigan(1966)使用多元回归模型预测Moody与S&P的评级,对各个不同的等级赋予主观数值,如Aaa为9,A a为8,最低为c,数值为1,依次类推,最后的回归模型包括总资产、债券顺位、营运资金,营运收入、净值,负债,净值周转率与净利率等。其预测的正确率对Moody为58%,S&P为52%。其次West也使用多元回归模型,利用其预测Moody与S&P的投资级债信评级,将Fisher(1959)用以估计风险溢价的自变量建立一个多元回归模型,针对Moody评级在B级以上的公司建立等级决定模型,其变数包括9年的获利变异性、偿债期间、负债权益比率与在外流通的债券总额等,正确率为62%。相对前述的危机预测,两者的准确率均不高,原因之一是前述的预测只有两类,非高即低,债券等级预测却可能多达9个等级,在其他条件固定下预测正确率下降属必然。
(四)神经网络分析法对财务危机进行预测虽然神经网络的理论可追溯到上个世纪40年代,但在信用风险分析中的应用还是始于上个世纪90年代。神经网络是从神经心理学和认识科学研究成果出发,应用数学方法发展起来的一种并行分布模式处理系统,具有高度并行计算能力、自学能力和容错能力。神经网络的结构是由一个输入层、若干个中间隐含层和输出层组成。国外研究者如Altman,Marco和Varetto(1995),对意大利公司财务危机预测中应用了神经网络分析法。Coats,Pant(1993)采用神经网络分析法分别对美国公司和银行财务危机进行了预测,取得了一定的效果。然而神经网络的最大缺点是其工作的随机性较强。因为要得到一个较好的神经网络结构,需要人为地去调试,非常耗费人力与时间,因此应用受到了限制。Altman(1995)在对神经网络法和判别分析法的比较研究中得出结论:神经网络分析方法在信用风险识别和预测中的应用,并没有实质性的优于线性判别模型。但神经网络作为一门崭新的信息处理科学仍然吸引着众多领域的研究者。
(五)财务因素的可量化性、数据的可获得性使其在传统的信用评估研究中受到广泛的关注由于财务因素在银行信用评估分析中存在滞后性、灰色性(财务报表披露的信息很大程度上带有不完整性,甚至虚假性)和短期性等诸多弊端,已有越来越多的学者将部分注意力转移到非财务因素上。认为借款企业不是处于一个封闭的系统中,必然还要受到外部因素的影响和制约,认为非财务因素是未来贷款风险的预警信号,因此,同时结合财务因素和非财务因素比仅用其中任一因素在违约率预测上更为精确。巴塞尔银行监督委员会(2001)要求银行不仅要考虑定量因素,还要考虑定性因素。《巴塞尔新资本协议》于2004年正式公布,其推广实施将对全球银行业的发展格局产生深远影响。新协议对银行风险管理提出了更高要求,强调了风险计量的精确性、敏感性和标准化,突出了内部评级法(Internal Ratings-Based Approaches,IRB)的地位和作用。正如巴塞尔委员会主席卡如纳所说,内部评级法作为新资本协议的核心技术,代表着未来银行业风险管理和资本监管的发展方向。内部评级系统所提供的违约概率(PD)、违约损失率(LGD)、预期损失(EL)以及非预期损失(UL)等关键指标,在授信审批、贷款定价、限额管理、风险预警等信贷管理流程中发挥着重要的决策支持作用。同时,该系统的计量分析结果也是制定信贷政策、计提准备金、分配经济资本以及实施RAROC管理的重要基础。
二、国有商业银行信贷风险评级中的问题分析
(一)信用评级指标体系的组成有待进一步深入研究目前国有商业银行使用的评级指标体系中选择的各项指标大多是通过内部从事信贷管理的专家确定的,属于专家意见法,缺乏对于各项指标能否灵敏反映借款企业违约率、企业信用水平的定量化研究。此外,科学的评级指标体系应该能够全面而不冗余、重复的反映评级对象的风险信息,仅通过专家意见法确定的评级指标体系难以实现这一目标。
(二)信用评级指标权重缺乏科学性目前评级方法中主要依靠专家的经验,即专家对各项指标相对重要性的认识,确定指标的各自权重,通过主观意见确定权重形成的评级办法在科学性与客观性方面都存在问题,影响了评级结果的准确性,因此科学合理的确定评级指标权重,提高评级结果的准确性是目前需要解决的重要问题。
(三)国内信用评级方法存在缺陷国内学者和专业人士提出的贷款信用评级方法主要包括信用评分法,综合评判法,判别分析法和神经网络预测法等,这些方法存在的主要缺陷:一是评级指标和权重的确定缺乏客观依据,基本依靠专家意见法确定,主观性较强,某些研究虽然应用了数理统计方法,但存在不能很好的解决反映风险有关信息重叠与遗漏矛盾等方面的向题;二是模型只能对是否违约进行判断,不能给出贷款违约概率等信息;三是由于模型不能给出贷款违约概率等信息,难以指导信贷定价等控制信用风险的工作;四是神经网络方法存在的黑箱性、过分拟合不稳定性、随机性,可能实现局部最优而非全局最优,因此这种方法的应用性受到不少人特别是实务界的怀疑。
(四)商业银行缺乏有效的信用风险防范和控制手段在信用风险防范和控制手段上,我国商业银行没有建立起分产品、分部门、分客户的核算机制和以内部资金转移价格为中心的定价体系。贷款审查通常是以定性分析为主,缺少市场细分,盲目吸纳大型客户,没有清晰的市场风险、行业风险和地区风险控制的政策目标。在信用风险发生后又急于抽回贷款,方式、方法过于简单,容易造成企业经营困难,甚至导致企业破产和银行不良贷款的积累。另外,我国信用评级行业尚处在起步阶段,存在问题较多,整体上难以达到国际上认可的技术和管理标准。健全的风险管理框架是实现全面风险管理的前提。国外银行通过引进内部评级制度,对信用风险进行识别、评估和分类,并由风险管理委员会等专职机构来统筹信用风险管理政策的执行和协调。而国内银行此方面管理职责分散,缺乏专门的管理部门,而且不同类型的风险由不同的部门负责。这种分散管理的做法,使得银行系统缺乏统一的风险管理战略和政策,高层管理者更是无法清楚了解银行面临的整体风险状况。同时,分散管理还使得有些信用风险因无人管理而陷入真空状态。另外,我国商业银行现行的组织管理结构为典型的“金字塔”式结构,在实践中存在管理层次多、决策滞后、风险集中、成本过高等问题,纵向过长的链条加上商业银行过大的规模使得信息传递和决策渠道存在过多环节,极易形成银行内部委托链条上的信息不对称,难以有效防范信用风险的发生。
三、国有商业银行内部评级体系构建的整体思路和方法步骤
神经网络中的注意力机制范文3
【关键词】中文识字;脑科学研究;最新进展;识字教育
【中图分类号】G610 【文献标识码】A 【文章编号】1004-4604(2015)11-0010-04
一、有关中文识字的脑科学研究最新进展
中文认知与拼音文字(如英语)认知的神经心理机制是否不同?有何不同?认知科学家们从神经生物学的角度开展了很多研究和探索。借助功能性磁共振成像(fMRI)等脑科学研究的新手段,研究者对中文识字有了许多新的发现,主要表现在以下两个方面。
1.中文认知加工中枢
人类大脑左前额中回区(Left Middle Frontal Gyrus,LMFG)是对个体认知控制和协调起非常重要作用的脑区。〔1,2〕左前额中回区包括许多脑区,如第八、九、十、四十五、四十六脑区等。有关中文认知的脑科学研究表明,与阅读拼音文字(如英语)相比,中文认知时的左前额中回区会被更强烈地激活。这是因为在中文认知时左前额中回区可以利用“视觉正字法形态”进行信息加工。众所周知,非字母形态的中文字形更多强调的是视觉正字法信息,较少关注音位加工。这可能也解释了为什么中文读者的左前额中回区的神经网络与拼音文字读者的大脑活动映射存在相当显著的差异。Perfetti 等人的研究证实了左前额中回区在中文认知中的作用。〔3〕谭力海等人还提出左前额中回区可能会参与中文语音和语义的分析,只是因为错综复杂的中文字形会让中文认知更多地进入自动的视觉正字法加工程序,所以左前额中回区的主要功能变为对文字特征进行协调和整合,以期进一步提高中文认知处理效率。〔4,5〕
有关中文认知的众多脑科学研究显示,左前额中回区的第九脑区(BA9)可能是中文认知的主要加工中枢。例如,Siok等人比较了阅读障碍儿童与正常儿童在中文认知过程中的大脑活动,结果发现,中文阅读障碍儿童在左前额中回区的第九脑区和第四十六脑区存在功能性损伤,〔6〕而对英语阅读障碍儿童的脑科学研究却发现这种功能性损伤主要存在于左颞顶枕和枕颞区域。〔7,8〕这些研究结果进一步表明中文认知和英文认知可能存在完全不同的认知加工中枢。Siok等人的进一步研究发现,左前额中回区第九脑区和第四十六脑区,特别是第九脑区,可以被看作是识别中文阅读障碍的一项有效指标,因为中文阅读障碍患者在这些脑区,尤其是第九脑区,普遍存在功能和结构畸变。〔9〕左前额中回区与中文认知之间的这种联系已经被后续众多研究进一步证实。系统分析已有的有关中文认知加工,特别是对字形、字音和语义加工的功能性磁共振成像研究结果会发现,第九脑区在中文认知加工中发挥了重要作用,比如从中文语义到语音的转换加工需要第九脑区的激活,从字形到语义的映射也需要第九脑区和顶叶区域的参与,从字形到语音的转换也需要第九脑区的参与,等等。〔10〕可以说,左前额中回区,特别是第九脑区,在中文认知中起着非常重要的作用,相当于中文认知的加工中枢。
2.中文认知的大脑网络通路
中文认知的大脑网络通路是怎样的?它和英文认知所涉及的大脑网络通路有什么区别吗?脑成像技术的新发展为研究者探索这些问题的答案提供了便利条件。正电子发射断层成像(PET)、事件相关电位(ERP)、功能性近红外光谱技术(fNIRS)和功能性磁共振成像(fMRI)等技术日新月异,便于研究者绘制出大脑的语言加工通路。例如,谭力海等人利用fMRI和PET技术探究了与中文加工、学习、记忆和注意力相关的神经解剖学机制。他们的研究表明,负责言语工作记忆的左前额中回区,尤其是第九脑区对中文识别有重要作用,而对英文认知有重要作用的后颞叶区在中文认知中参与程度很低。〔11〕他们还发现中文和英文阅读的神经加工系统是由两种语言文字的早期学习经历所塑造的,左前额中回区的活动程度是判断中文阅读障碍的神经生物学标志。〔12〕这一研究佐证了不同的母语早期学习障碍儿童需要不同的早期干预方案的观点。
需要特别指出的是,虽然第九脑区是中文认知加工中枢,但这些认知活动其实是大脑前额叶和顶叶网络协调合作的结果,中间额叶皮层和顶叶上回皮层都广泛参与了中文认知加工过程。〔13〕谭力海等人在一项通过语义和同音异形异义字决策任务来探究中文认知神经加工机制的研究中发现,左前额中回区(第九脑区)、右额叶和顶叶都在中文认知过程中被激活。〔14〕这可能与中文是方块字、大脑需要更多的空间加工信息有关。Booth 等人也发现左前额中回区和顶叶脑区在需要语音和语义加工的任务中会被同时激活。〔15〕关于中文认知的大脑网络通路,Chen等人的研究工作也非常出色。〔16〕他们对比了与不同认知机制相关的大脑活动模式,发现拼音文字与中文所需要的认知机制有着明显差异。他们发现,阅读拼音文字会引发顶叶双侧皮层(楔前叶和前颞中回)更强烈的激活,而阅读中文激活的是左侧梭状回、双侧楔叶、后颞、额下回和双侧额上回。这些研究结果意味着,中文与拼音文字的认知存在不同的大脑网络通路。
二、脑科学研究成果对幼儿识字教育的启示
1.可以适当开展早期识字和阅读活动
有研究者对香港学前儿童进行了为期两年的追踪研究,发现同音语素意识、视觉技能和语音意识与中文识字能力显著相关,而视觉技能和音节删除能力与中文听写能力显著相关。〔17〕同年,该研究团队发现5岁时的语音意识和快速自动化命名(RAN)能力可以有效预测6岁时的拼音能力,并且能有效预测小学时的中文识字水平。〔18〕快速自动化命名还能够预测个体中文阅读的流畅性。研究者发现,词汇是中文读写能力的主要预测变量,执行能力(Executive Function)则能够很好地预测幼儿早期的中文识字水平。〔19〕诸如此类的脑科学研究表明,语音意识、视觉技能、快速自动化命名能力等能显著预测个体中文认知加工能力的发展水平,而这些能力都是可以在幼儿阶段的游戏和学习活动中逐步培养的。如果能在幼儿园阶段适当开展一些早期识字和阅读活动,并在活动中有意识地培养幼儿的早期阅读技能,则对促进幼儿中文认知能力的提高有较大帮助。
2.可以适当开展游戏化的记忆训练、感知运动游戏等活动
脑科学研究结果显示,左前额中回区第九脑区是中文认知加工的神经中枢,它主管工作记忆,并与负责动作的大脑运动皮层位置相近,而左脑后部则关乎字母与声音的转换,并与负责声音的大脑听觉皮层位置相近。因此,对工作记忆和感知运动机能的训练可能会对幼儿的中文学习更有帮助,而在字母与声音的转换和提高声音辨识敏感性方面的训练会对英文学习更有益。如果能在幼儿园阶段适当开展一些游戏化的记忆训练、感知运动游戏等活动,并在活动中有意识地培养幼儿的感知运动技能,则会对强化幼儿的中文认知中枢机能有较大帮助。
3.重视幼儿早期识字和阅读教育的理论与实践探索
脑科学研究证实,中文与拼音文字认知存在不同的大脑网络通路,而早期阅读的过程其实就是个体主管中文或拼音文字阅读加工的大脑皮层功能及其神经回路特异化的过程,并最终会形成在结构与功能上不太相同的“中文脑”或“英文脑”。中文认知和拼音文字认知存在截然不同的神经加工中枢和大脑网络通路,因此,我们需要重视符合“中文脑”特点的早期阅读教育、课程与教学法、早期识字活动等的理论与实践探索,而不能照搬西方理论。我们应当对那些盲目推崇西方全语言教学法、语音意识训练和读写萌发课程等的做法抱谨慎态度。
例如,在政策方面,中国目前只有香港特区政府允许在幼儿园开展幼儿识字教育活动,并有明确的相关课程指引。在其他地区,正式的识字教育活动是在幼儿园被明令禁止的,而事实上有许多幼儿园又或明或暗地在开展幼儿识字教育活动。美国的阅读战争(The Reading War)启示我们,早期识字和阅读教育是有必要的,因为早期识字是利大于弊的。美国现在已经在改正以往的错误了,我们也有必要对当下的教育政策进行科学论证。建议教育主管部门能组织幼儿中文教育专家对幼儿识字教育问题展开专项的科学实证研究,在有科学研究支持的基础上,及时调整、规范幼儿识字教育的相关政策,以期彻底解决目前的某些混乱现象。
又如,在幼儿园课程与教学方面,许多问题需要在有科学研究依据支持的前提下加以改进。例如,幼儿中文识字教育应该以什么形式开展?是识字优先还是拼音优先?是先读后写还是边读边写?诸如此类的困惑亟待通过科学研究加以解决。教育主管部门确实有必要组织专业人员开展深入的研究,以探究符合中国国情的幼儿园课程与教学安排。
参考文献:
〔1〕MILLER E K,COHEN J D.An integrative theory of prefrontal cortex function〔J〕.Annual Review of Neuroscience,2001,24(1):167-202.
〔2〕PERFETTI C, CAO F, BOOTH J. Specialization and universals in the development of reading skill: How Chinese research informs a universal science of reading〔J〕.Scientific Studies of Reading,2013,17(1):5-21.
〔3〕LIU Y,DUNLAP S,FIEZ J,et al.Evidence for neural accommodation to a writing system following learning〔J〕.Human Brain Mapping,2007,28(11):1223-1234.
〔4〕〔14〕TAN L H, LIU H L, PERFETTI C A, et al.The neural system underlying Chinese logograph reading〔J〕.Neuroimage,2001,13(5):836-846.
〔5〕〔11〕TAN L H,SPINKS J A,FENG C M,et al.Neural systems of second language reading are shaped by native language〔J〕.Human Brain Mapping,2003,18(3):158-166.
〔6〕SIOK W T, PERFETTI C A, JIN Z, et al.Biological abnormality of impaired reading is constrained by culture〔J〕.Nature,2004,431:71-76.
〔7〕HOEFT F, HERNANDEZ A, MCMILLON G,et al.Neural basis of dyslexia:A comparison between dyslexic and nondyslexic children equated for reading ability〔J〕.The Journal of Neuroscience,2006,42(26):10700-10708.
〔8〕PAULESU E,DEMONET J F,FAZIO F,et al.Dyslexia:Cultural diversity and biological unity〔J〕.Science,2001,291:2165-2167.
〔9〕SIOK W T,NIU Z,JIN Z,et al.A structuralCfunctional basis for dyslexia in the cortex of Chinese readers〔J〕.Proceedings of the National Academy of Sciences,2008,105(14):5561-5566.
〔10〕WU C Y, HO M H R, CHEN S H A. A meta-analysis of fMRI studies on Chinese orthographic, phonological, and semantic processing〔J〕.Neuroimage,2012,63(1):381-391.
〔12〕SIOK W T, JIN Z, FLETCHER P, et al.Distinct brain regions associated with syllable and phoneme〔J〕.Human Brain Mapping,2003,18(3):201-207.
〔13〕KUO W J, YEH T C, DUANN J R, et al. A left-lateralized network for reading Chinese words:A 3 T fMRI study〔J〕.Neuroreport,2001,18(12):3997-4001.
〔15〕BOOTH J R,LU D,BURMAN D D,et al.Specialization of phonological and semantic processing in Chinese word reading〔J〕.Brain Research,2006,1071(1):197-207.
〔16〕CHEN Y,FU S,IVERSEN S D,et al.Testing for dual brain processing routes in reading:A direct contrast of Chinese character and pinyin reading using fMRI〔J〕.Journal of Cognitive Neuroscience, 2002,14(7):1088-1098.
〔17〕TONG X, MCBRIDE-CHANG C, WONG A M Y,et al.Longitudinal predictors of very early Chinese literacy acquisition〔J〕.Journal of Research in Reading,2011,34(3):315-332.
神经网络中的注意力机制范文4
教育部人文社会科学研究规划基金项目(10YJAXLX001),羊城学者首席科学家资助项目(10A030S)。
通讯作者:曾红,E-mail:tzhyn@jnu.省略。
摘 要:镜像神经是近年来认知与大脑神经科学研究中崭新的课题,大量实验证实了镜像神经元(系统)参与到了多种心理能力的发展与进化之中。目前有研究发现,吸烟相关线索会激活尼古丁成瘾者大脑相应的动作脑区,而该区域也正是人类镜像神经区域,这意味着镜像神经在相关线索激发的心理渴求中可能扮演了重要角色。该实验结果有重要的意义,动作计划脑区的神经线索反应为发展可靠的依赖行为的生物学标记提供了另一个新目标,不仅开发了一个新型的依赖行为的理论模型,还为把神经科学的研究发现运用到实践应用打下了良好的基础。
关键词:镜像神经;药物依赖;心理渴求
中图分类号:B8409
文献标识码:A 文章编号:1003-5184(2012)01-0013-04
药物依赖是一种长期的复发性脑疾病,其治疗是一个世界性难题。持续存在的心理渴求(craving)及其导致的复吸(relapse)是产生药物依赖的核心问题。药物心理渴求是一种想重新感受神经活性药物效应的一种渴望(Drummond,2001)。由于渴求可能激发复吸和持续的药物滥用及依赖,因此了解心理渴求的神经生物学基础,对于理解药物依赖的病理生理过程以及寻找有效的复吸治疗具有重要意义。
用药相关线索和急性应激是药物渴求的两大诱因(陆林等,2009)。药物依赖者因长期用药产生了对药物相关环境线索的高度敏感性。临床研究发现,在药物依赖戒断后,如果再次接触或回到先前的吸毒环境,观察到他人的吸毒行为,或者遭遇应激,都可以发生复吸(Shah,2003)。因此药物依赖治疗的关键是解除生理脱毒后对药物的心理渴求,以防止复吸(Grimn et al.,2001)。要解除这种心理渴求,就必须了解心理渴求的心理行为特点及其神经机制,对症下药,才有可能找到有效的治疗方法。
第32卷第1期
曾 红 镜像神经系统―研究药物依赖行为的新靶点
心理学探新2012年
关于药物依赖的神经心理学研究尤其是关于相关线索下的心理渴求的神经机制已经累积了丰富的经验性数据,但目前大多数的研究都集中在奖赏、学习和行为控制的大脑机制上,一直缺乏新的理论指导,源于镜像神经研究的概念化理论,可以丰富对相关线索下心理渴求研究的引导,从新的角度开展依赖行为的研究。目前已有的研究显示:动作脑区的神经活动(部分与镜像神经系统重合)已被频繁地牵涉到各类物质依赖疾病当中。包括各类药物依赖。因此,从镜像神经(动作脑区)出发,探索其活动、功能及其与其他脑区活动的关联,有可能帮助我们找到心理渴求产生的神经机制,并进而发展相应的治疗方法。
1 镜像神经的定位与功能
镜像神经元是一组猴脑运动前皮质和顶叶皮质的视觉神经元,负责执行操作和观察目标行为的动作,被认为灵长类动物社会能力的生物基础(Casile,Caggiano,& Ferrari,2011)。
自从Rizzolatti等人在猴脑F5 区发现镜像神经元后,开始利用功能核磁共振fMRI 等脑成像技术对人脑进行研究。近期的行为和影像研究显示,当人类在心里重复一个熟悉的动作,在一些动作表现中会激发一些相同的神经操作,类似的,在观察他人动作时,在许多相同的通常用于动作的大脑区域,也显示出神经激活的特征,包括运动前皮质,同时,观察他人行为表现时,大部分在背侧前运动皮层的与完成任务相关的神经也显示相同的激活模式(Nelissen,K.,Luppino,G.,Vanduffel,W.,et al.,2005)。激活的大脑皮层中有3个主要区域。其中一个是颞上沟(superior temporal sulcus,STS),这个区域的神经元会在自愿者观察身体部位的运动时作出反应。另外两个区域是顶下小叶(inferior parietal lobule,IPL)和额下回(inferior frontal gyrus,IFG),它们所对应的顶下小叶以及腹外侧运动前皮质(ventral premotor cortex)正是发现镜像神经元的F5区域(Paul et al.,2004)。这说明人类大脑左前额叶皮层的Broca 区、腹外侧运动前皮质、顶下小叶、额下回、等区域同样存在着这些能将观察动作和执行动作匹配起来的具有镜像属性的神经元(Rizzolatti & Craigherm,2004)。
不仅与动作模仿和观察相关的行为会激活镜像神经,镜像神经同时还具有理解、分析动作的目的和性质的功能。Gazzola等人的实验中,要求被试看人的手臂和机器手臂做相同的动作的视频,虽然人的手臂和机器手臂运动的方式和细节特征很不相同,但两种条件下,都激活了被试相同的顶-额镜像回路,说明该神经回路能够从复杂的动作细节中概括出动作目标和意义,这正是镜像神经的重要功能之一(Gazzola,2007;姚远,2011)。最新的研究还发现,运动前皮质被执行动作与观察同样的动作激活,同时也会被所观察的动作所处的位置不同程度地调节,显示镜像神经对观察到的动作行为进行编码,不仅是为了理解动作,也是试图分析这样的动作,以做(模仿)出适当的行为(Caggiano et al.,2009)。
这些结果表明人脑中统一存在具有镜像功能的神经系统,这些镜像神经系统可能是人类进行模仿学习(imitation learning)的基础(Meltzoff & Decety,2003)。在发现人脑镜像神经系统之前,William James 解释模仿行为,认为人类观察到的行为会在某种程度上激活自己相应的行为模式,类似于启动效应(Iacoboni & Dapretto,2006)。但这些解释并未指出实际上人们对行为的观察和执行是基于一个共同的机制,这个机制从现在的研究结果来看就是镜像神经系统,其核心特征是观察他人行为可以激活自己大脑中负责编码及执行这些行为的皮层,包括运动皮层,在腹侧额叶的运动前区皮层及初级运动皮层的激活使得人们经历着“perceiving is doing”,并达到动作理解及分析和推测他人的意图,从而进行具身模仿(embodied simulation)并完成动作的输出。也就是说,观察者与被观察者经历了同样的神经生理反应,从而启动了一种直接的体验式理解方式:在负责产生运动神经反应(IFG 和VPC)的大脑部分区域的参与下,通过一种直接的映射机制,就可以充分感知他人运动时的身体动作及其所隐含的意义,并产生外在或内隐的模仿,或使人们对观察到的情绪有“感同身受”的体验,从而达到理解行为、情感的目的,这就是具身模仿。
但镜像神经的功能还不仅是具身模仿,不同的模仿行为会引发不同的镜像神经的激活。近期的一项研究发现带着学习的意图去模仿行为和单纯的模仿相比,镜像神经激活有不同;动机对镜像神经激活具有调节作用:对于观察他人拿食物这一情境,镜像神经元系统的激活水平和饥饿程度表现出正相关,证明了进食的动机影响着被试观察他人行为的神经回路(Cheng et al.,2007);另外从脑的发展来看,研究还发现,后天的学习经验在很大程度上影响着镜像神经的激活程度:专业的芭蕾舞演员和非芭蕾舞专业的舞蹈演员在观看芭蕾舞蹈片断时镜像神经系统的激活有显著区别,观看和自己专业相关的舞蹈动作时运动前区皮层、上顶叶、颞上沟等镜像神经系统激活程度更加明显(Calvo-Merino et al.,2005)。
镜像神经是近年来认知与大脑神经科学研究中崭新的课题,镜像神经元分布十分广泛,在两个大脑半球的重要区域都有分布,包括运动前皮质(premotor cortex)和顶叶皮质(parietal cortex)。当前有大量实验证实了镜像神经元(系统)参与到了多种心理能力的发展与进化之中(Cisek,P.,John,F.,Kalaska,J.F.,2004)。因此镜像神经的发现,可以帮助人们更进一步理解人类行为,并寻找到某些心理疾病行为的神经机制,从而为发展适当的治疗提供理论基础。
关于镜像神经的研究目前正处于蓬勃发展中,但它在人类活动中的功能研究依旧非常有限,大部分研究仍然集中在基础部分,对简单动作进行实验室影像观察、分析,而对实际生活中的人类行为研究得少。若要从镜像神经的角度进一步理解人类行为之谜,则需要把研究视角转向实际生活,把镜像神经科学的研究发现运用到实践应用中,为人类的社会生活实践提供更多答案,解决更多问题。而药物依赖问题正是其中之一。
2 心理渴求神经机制研究新发现――动作脑区与镜像神经
相关线索下的心理渴求一直是药物依赖领域研究的重点,经典的关于相关线索下心理渴求机制的影像研究,一直集中于高级神经活动,几乎没有涉及动作大脑区域的研究,其功能主要集中在奖赏、学习和行为控制的大脑机制上(Volkow,N.D.,Fowler,J.S.,& Wang,G.J.,2004)。这可能是因为基于广为流行的ROI的神经影像数据分析,对大脑区域的分析范围常常局限在大脑结构,如纹状体和前额皮质。但实际上,这些脑区域已经在动物研究领域得到广泛研究,而且在有关的依赖行为中得到验证。而且已有的研究结果不能完全说明渴求感是如何产生的,尤其是相关线索引发的心理渴求,因此需要从新的角度和方向对相关线索下的心理渴求进行探索。
早期对尼古丁成瘾者的研究显示,与吸烟有关的物体引发额中回,前运动皮质和顶上小叶的线索反应,这些区域是典型的熟练使用工具区域(Wagner et al.,2011)。最近一项关于尼古丁成瘾者在相关线索下的心理渴求的神经机制研究发现动作脑区(额下回和顶上小叶及前运动皮质)在相关线索引发的渴求过程中的作用,该项研究为进一步从镜像神经的角度研究药物渴求提供了重要的研究起点和可能性。
该研究发现,吸烟者在左半脑的顶内沟、额下回三角区域内呈现显著的与吸烟线索相关的神经活动,此外,吸烟者还在背侧前扣带回,眶额皮层以及双脑的背外侧前额叶呈现明显的吸烟相关线索活动。相反,不吸烟的对照组在被定义为与观看对象有关的任何脑区域都没有显示显著的活动。这说明,观察吸烟的尼古丁成瘾者比不抽烟的人会更强的激活顶内沟和额下回,这正是动作观察神经网络(AON Action Observing Neurno)参与其中的结果。除此之外,AON也参与观察,计划和模仿行为,因此吸烟行为有关的动作神经不仅是被物体本身所激活,当吸烟者观看完一个有象征意义的与吸烟有关的动作(如一个人使用打火机)后,实际会内隐模仿吸烟行为,这会激活大脑的相关区域,如额下回和顶内沟,同时,这种内隐动作回应(motor resonance)将降低执行实际吸烟行为的阈限并提高戒烟者复吸的可能性。
在此,相关线索引发渴求的过程中,为什么大脑动作反应区会被激活,它是如何被激活的?它和经典研究发现的前额部及纹状体的激活的不同之处在此非常重要。前顶内沟,额下回属于动作观察神经网络(AON),是镜像神经的一部分;额中回,运动前皮质和顶上小叶代表了与吸烟有关的工具使用技能和关于吸烟用具的吸烟动作知识(Yalachkov & Naumer,2011),这是与经典的心理渴求的神经机制截然不同的脑神经活动。Wagner等人的这一关于吸烟相关线索激活大脑相应的动作区域的发现有重要的意义,为发展更为可靠的依赖行为的生物学标记提供了另一个目标。该研究成果不仅开发了一个新型的心理渴求的理论模型,还为把神经科学的研究发现运用到药物依赖治疗的实践应用打下了良好的基础。
因为这一发现意味着心理渴求相关线索可能激活了两种神经活动:除了经典的前额叶相关区域的激活外,还有动作大脑区域的激活。动作脑区所包括的顶内沟,额下回所相对应的顶下小叶以及腹外侧运动前皮质(ventral premotor cortex)正是发现镜像神经元的F5区域。属于镜像神经,负责将观察动作和执行动作匹配起来的,是人类进行模仿学习(imitation learning)的基础神经机制(Meltzoff & Decety,2003),确切地说,是具身模仿的神经基础。而具身模仿的重要特点即在观察他人行为的同时,通过直接的映射机制,产生外在或内在的模仿行为,并理解行为的意义。这意味着在相关线索下的药物成瘾者,有可能在线索的刺激下,激活相关的动作脑区,并产生内隐地用药行为模仿,这种内隐用药模仿行为,将进一步增强对药物的心理渴求,而增高复吸的可能性。
同时,前额叶是高级神经活动区域,是信息的整合中枢,与工作记忆、计划和行动的准备、不当行为的抑制以及药物相关刺激的注意有关,在认知过程中发挥重要作用(Bonson et al.,2002)。渴求过程中前额叶皮层的神经活动显著可能表明注意、工作记忆和情感加工等多项过程参与渴求状态的形成和维持,成瘾者对于线索给予更多的注意,并且通过工作记忆的参与,来发起并维持渴求状态(Garavan et al.,2000)。
3 结论
联系镜像神经和高级神经在相关线索下的激活情况,可以形成镜像神经和高级神经共同作用,引发相关线索下心理渴求的途径(理论假设)。这一途径即是:相关线索激活动作脑区(镜像神经),并成为镜像神经功能参与并促进渴求形成的起点。观察到相关线索的成瘾者,其镜像神经被激活,由于镜像神经的核心特征使得成瘾者经历着被观察者同样的感受,“perceiving is doing”意味着看到对方用药,就是自己用药的感觉,这正是镜像神经的具身模仿(embodied simulation)特征。这一模仿过程可能表现为两种形式:动作的内隐输出或外在输出,当成瘾者的动作输出表现为内隐地模仿时,能够使观察的成瘾者与被观察者的身体图示之间形成一个“共享簇”(share manifold),充分感知被观察者的身体动作所隐含的意义,并产生特定的 “意图共鸣” 状态。这种 “意图共鸣”使成瘾者产生或增强药物渴求感,降低复吸的阈限,提高复吸的可能性;当这一动作输出表现为外在模仿时,则意味着直接的复吸行为。从整体来看,镜像神经的激活,使动作脑区即负责产生运动神经反应的大脑部分区域参与相关线索-观察-渴求反应形成的过程中,同时由于镜像神经功能形成的心理渴求又进一步激活前额叶皮质等高级神经活动区域,包括奖赏中枢,使注意力、工作记忆、抑制性,共同参与到渴求的进一步形成和维持过程。
镜像神经理论所揭示的人类模仿行为和共情的能力和对尼古丁成瘾者动作脑区的研究结果也许可以解释相关线索下成瘾者的心理渴求的发生机制,为进一步从镜像神经(动作脑区)的角度,采用脑成像方法探索心理渴求产生的神经机制,找到引发药物成瘾者戒断后重新复吸的根本原因提供了基础,这对成瘾者戒断后复吸的预防和干预都将有很大指导作用,对药物成瘾的研究具有重要意义。当然,具体的过程还需要进一步的实验和临床实证研究。
参考文献
陆林,王曦,罗宜孝,张肖丽,时杰.(2009).药物依赖戒断后心理渴求的神经机制及干预措施.北京大学学报(医学版),1,282-284.
姚远.(2011).灵长类镜像神经系统研究的最新进展.生物物理学报,27,99-107.
Bonson,K.R.,Grant,S.J.,Contoreggi,C.S.,et al.(2002).Neural systems and cue-induced cocaine craving.Neuropsychopharmacology,26,376-386.
Casile,A.,Caggiano,V.,& Ferrari,P.F.(2011).The mirror neuron system a fresh view.Neuroscientist,17,524-538.
Cisek,P.,John,F.,Kalaska,J.F.(2004).Neural correlates of mental rehearsal in osal premotor contex.Nature,431,993-996.
Caggiano,V.,Fogassi,L.,& Rizzolatti,G.(2009).Mirror neurons differentially encode the peripersonal and extrapersonal space of monkeys.Science,324,403-406.
Calvo-Merino,B.,Glaser,D.E.,Grezes,J.,Passingham,R.E.,& Haggard,P.(2005).Action observation and acquired motor skills:an fMRI study with expert dancers.Cerebral Cortex,15,1243-1249.
Cheng,Y.,Meltzoff,A.N.,& Decety J.(2007).Motivation modulates the activity of the human mirror-neuron system.Cerebral Cortex,17,1979-1986.
Drummond,M.D.C.(2001).Theories of drug craving,ancient and modern.Addiction,96,33-46.
Filimon,F.,Nelson,J.D.,Hagler,D.J.,& Sereno,M.L.(2007).Human cortical representations for reaching:Mirror neurons for execution,observation,and imagery.Neuroimage,37,1315-1328.
Garavan,H.,Pankiewicz,J.,& Bloom,A.,et al.(2000).Cue-induced cocaine craving:neuro anatomical specificity for drug users and drug stimuli.Am J Psychiatry,157,1789-1798.
Gazzola,V.,Rizzolatti,G.,Wicker,B.,& Keysers,C.(2007).The anthro pomorphic brain:The mirror neuron system responds to human and robotic actions.Neuroimage,35,1674-1684.
Grimm,J.W.,Hope,B.T.,Wise,R.A.,et al.(2001).Neuro adaptation in cubtion of cocaine craving after withdrawal.Nature,412,141-142.
Iacoboni,M.,& Dapretto,M.(2006).The mirror neurons system and the consequences of its dysfunction.Nature Reviews Neuroscience,7,942-951.
Meltzoff,A.N.,& Decety,J.(2003).What imitation tells us about social cognition:a rapprochement between developmental psychology and cognitive neuroscience(Phil,Trans.).R.SocLond.B,358,491-500.
Nelissen,K.,Luppino,G.,Vanduffel,W.,Rizzolatti,G.,& Orban,G.A.(2005).Observing others:Multiple action representation in the frontal lobe.Science,310,332-336.
Rizzolatti,G.,& Craigherm,L.(2004).The mirror neuron system.Annu Rev Neurosci,27,169-192.
Shaham,Y.,Shalev,U.,Lu,L.,et al.(2003).There instatement model of drug relapse:history,methodology and major findings.Psychopharmacology (Berl),168,3-20.
Volkow,N.D.,Fowler,J.S.,& Wang,G.J.(2004).The addicted human brain viewed in the light of imaging studies:brain circuits and treatment strategies.Neurophammacology,47,3-13.
Wagner,D.D.,Sonya,D.C.,Sargent,J.D.,Kelley,W.M.,& Heatherton,T.F.(2011).Spontaneous action representation in smokers when watching movie characters smoke.The Journal of Neuroscience,31,894-898.
Yalachkov,Y.,& Naumer,M.J.(2011).Involvement of action-related brain regions in nicotine addiction.Journal of neurophysiology,106,1-3.
Mirror Neruon System-New Target for Research of the
Neuro Mechnism of Drug Dependence
Zeng Hong
(The Division of Medical Psychology & Behavior Science of Medical School,Jinan University,Guangzhou 510632)
Abstract:
神经网络中的注意力机制范文5
关键词 威胁性信息;杏仁核:皮层通路;皮层下通路
分类号 B845
1 引言
我们的大脑每时每刻都接受大量感觉信息的输入,即使在睡眠状态下,也有源源不断的信息涌人大脑。由于容量的限制,大脑只能选择一部分信息进行完全的加工。一般认为,选择性注意通过对刺激的选择和过滤,能够促进与当前期望或行为目标相一致的刺激的加工,而这一机制主要由额顶注意网络(frontoparietai attention network)进行自上而下(top-down)的调节(Brosch & Wieser,2011)。除了这种调节机制,还有一些刺激具有自动捕获注意的能力(Michael & Gálvez-García,2011),其中威胁性刺激就具有这种注意的优先性(Reeck,LaBar,& Egner,2012)。
对威胁性刺激的快速、自动化加工使得动物能迅速作出逃跑或攻击的决定,提高生存概率(Boyer & Bergstrom,2010)。突发性、威胁性事件对人类的生存和生命安全同样具有重要影响,为了提高生存概率,神经系统必然会进化出一个专门的系统来处理这类事件(Brosch & Wieser,2011)。Boyer和Bergstrom(2011)认为,儿童发展过程中对威胁信息的应答顺序很好地反映了人类进化过程中遭遇的威险。一些学者对威胁检测的脑机制进行了探索,比如,Candidi,Stienen,Aglioti和de Gelder(2011)采用事件相关的重复经颅磁刺激(repetitive Transcranial Magnetic Stimulation,rTMS)技术检测了人脑对威胁性动物和身体姿势的反应,结果表明颞上回后部(posterior SuperiorTemporal Sulcus,pSTS)对检测威胁性的身体姿势具有特异性,杏仁核-颞叶-皮层回路在威胁性身体姿势的检测中发挥重要作用。Conty,Dezecache,Hugueville和Grèzes(2012)最新的研究发现,对威胁性身体姿势的检测有一条快速通道,情绪内容在刺激呈现后170 ms左右就可以由杏仁核(amygdala)检测到。这暗示了威胁性刺激不仅能够快速捕获注意,而且这一过程是由特定的神经结构来完成的。虽然对威胁信息的检测在人和动物中有着相似的机制,但威胁检测不仅具有先天的基础,还受到后天经验的影响(Eilam,Izhar,& Mort,2011)。例如,Monk等(2004)的研究表明对威胁信息的注意可以通过训练而改变,并会引起枕颞皮层(the occipitotemporal cortex)活动水平的变化。
早期的研究发现,杏仁核能够检测威胁性刺激并通过向感觉皮层和额顶注意网络提供反馈而促进该类刺激的加工(Dalgleish,2004;LeDoux,2003),但是杏仁核在威胁性信息加工中的具体作用还不十分明了。一方面,杏仁核的作用可能不仅仅是加工威胁性信息,而是对于与当前的行为目标和动机相关的所有刺激都会作出反应(Cunningha m &Brosch,2012)。另一方面,杏仁核与注意的关系还不明确。其早期加工可能是不需要注意参与的,而晚期加工却受到注意的调节(Pourtois,Spinelli,Seeck,& Vuilleumier,2010),这表明杏仁核在不同时段的活动可能涉及不同的环路。此外,Tsuchiya,Moradi,Felsen,Yamazaki和Adolphs(2009)发现,双侧杏仁核完全损伤的病人虽然不能识别出恐惧面孔,但是能够对恐惧、愤怒面孔以及威胁性场景进行快速检测和无意识加工。他们认为杏仁核的功能不是检测威胁性信息,而是调节知觉和社会性判断。最近的研究发现威胁性信息的检测可能在杏仁核之前的视觉通路中就已经完成了(Maratos,Senior,Mogg,Bradley,&Rippon,2012),并且这一过程可能是在皮层下通路(subcortical pathway)中实现的(Pegna,Khateb,Lazeyras,& Seghier,2004)。这些研究都对杏仁核负责检测威胁性信息的观点构成了挑战,而将威胁信息检测的功能指向了更早的加工过程。
对威胁性信息检测的研究主要涉及两大问题:一是注意与威胁性信息检测的关系。杏仁核在威胁性信息的自下而上(bottom-up)加工和自上而下加工中占据枢纽地位(Ochsner et a1.,2009;Wright et a1.,2008),与威胁性信息的注意机制有密切关系。二是威胁信息检测的神经通路。威胁性信息的视觉检测可能在两条通路中完成:皮层下通路能够实现迅速的信息检测,而皮层通路则能够对威胁信息进行精确加工。由两条通路传入的信息会在杏仁核等更高级的脑结构中进行整合,最终完成威胁性信息的检测,为有效应对威胁做好准备。
2 威胁性信息检测的注意机制
威胁性信息具有注意优先性,这种优先性具有重要的生存意义,其检测机制可能与皮层下结构的快速加工有关(Pessoa & Adolphs,2010)。许多研究认为,皮层下结构将威胁性信息传递至杏仁核,然后由杏仁核调节对威胁性信息的注意。从解剖结构上看,杏仁核与知觉通路上的多个皮层区域存在广泛的双向联系,包括初级视皮层(primary visual cortex)、颞下回(inferior temporalgyrus)等负责感觉信息加工的区域,以及眶额皮层(orbitofrontal cortex)、前额皮层(prefrontal cortex)等高级认知加工区(Cunningham & Brosch,2012)。这种广泛的联系使得杏仁核一方面能够获得丰富的感觉信息,并通过感觉通路的反馈增强对威胁信息的神经表征;另一方面能够接受额叶的调节,使得情绪加工和审慎的决策和复杂的动机联系起来。可以说,杏仁核在情绪信息的加工中处于联结知觉和决策的枢纽地位。然而,这是否意味着杏仁核就是威胁性信息检测的中枢呢?
早期的研究认为,杏仁核对威胁性刺激的检测是完全自动化的、不需要注意资源的(Davis &Whalen,2001,),然而最近的研究对这一观点提出了质疑。比如,Vuilleumier,Arrnony,Driver和Dolan(2001)发现,即使在非注意条件下,杏仁核对情绪性刺激的反应也比对中性刺激的反应强烈。而Pessoa,McKenna,Gutierrez和Ungerleider(2002)却发现在高注意负荷(attentional load)条件下,杏仁核对威胁性刺激的反应显著降低了。这些冲突的结果使我们不得不思考杏仁核与注意的交互作用,下面我们从多感觉加工、多过程加工和注意捕获的角度分析杏仁核活动与注意的关系。
第一,从多感觉加工的角度看,在真实生活场景中,人们总是同时接收视觉、听觉、嗅觉、触觉等多种感觉信息的输入,任何一个通道都可能包含威胁性信息。如果威胁信息的优先加工是大脑功能组织的一般原则,那么即使注意集中在其他的感觉通道,威胁信息应该仍然能激活杏仁核。Brosch,Grandjean,Sander,& SchereL 2009;Zeelenberg和Bocanegra(2010)的研究表明,当被试的注意力集中在视觉通道时,威胁性的听觉信息能够促进对视觉目标的识别,在加工的早期增强大脑对视觉目标的反应。此外,还有研究发现视觉情绪信息能够减少分配在听觉惊奇刺激上的资源,使得对注意敏感的脑电成分P3的波幅减小(Keil et a1.,2007)。这些行为和脑电研究至少为“情绪信息在注意之外的通道中的加工具有优先性”这一观点提供了间接的证据。
然而,Mothes-Lasch,Mentzel,Miltner和Straube(2011)的研究中却没有发现跨通道加工的效应。他们给被试呈现愤怒或中性的声音,同时用视觉呈现十字或圆圈。被试必须同时注意视觉和听觉信息,判断听觉呈现的声音是男声还是女声,以及视觉呈现的是十字还是圆圈。在这种跨感觉通道的情境下,双侧颞上回、左侧杏仁核以及左侧脑岛(insula)都只有在注意听觉通道的时候才会出现显著激活。当被试注意视觉信息时,愤怒的声音没有引起杏仁核的激活。因此,作者认为杏仁核和听觉皮层对威胁声音的反应依赖于通道特异性(modality-specific)的注意。然而该结果也可能是由磁共振(Magnetic Resonance Imaging,MRI)信号的时间分辨率较低造成的。由于磁共振的信号比较缓慢,这可能导致极短时间内的信号被混合在一起,在信号平均的过程中被抵消掉(Brosch & Wieser,2011)。此外,那些报告杏仁核自动激活的研究(Vuilleumier et a1.,2001)多使用事件相关设计(event-related design),而报告杏仁核受注意调节的研究(Mothes-Lasch et a1.,2011;Pessoa et a1.,2002)采用了组块设计(blockdesign)。两种实验设计的不同时间特性也可能是造成这些冲突结果的重要原因。因此,威胁性信息的跨通道注意效应不能被简单否定。
第二,从多过程加工的角度看,最近的两项研究(Luo et a1.,2010;Pourtois et a1.,2010)采用具有毫秒级时间分辨率的颅内脑电(intracranialelectroencephalography,iEEG)和脑磁图(Magnetoencephalography,MEG)技术揭示出两个分离的加工过程:杏仁核对威胁性面孔的早期反应不需注意的参与,而其晚期反应受注意调节。Pourtois的团队对一位杏仁核外侧电极植入的患者进行了局部场电位(local field potentials)的测量,结果发现无论注意是否指向威胁性刺激,杏仁核都会在极短的时间(140—290 ms)内对之作出响应。大约700ms以后,杏仁核的活动就受到注意的调节:当注意指向情绪刺激所在的通道时,杏仁核就会作出响应,反之就不作出响应。Luo的团队则用脑磁图记录了高注意负荷和低注意负荷条件下杏仁核对威胁性面孔和中性面孔的反应,在威胁性面孔呈现30-60ms之后,杏仁核的gamma波段的能量出现了快速的升高,该活动不受注意负荷影响。在280-340ms左右,杏仁核与注意负荷产生交互作用,在低注意负荷下,观察到威胁性面孔时杏仁核的gamma波段能量出现升高,但在高注意负荷下,杏仁核没有表现出对威胁性面孔的反应。这两个研究一致表明:在早期加工中,杏仁核的激活不受任务负荷和注意分配的影响:而在稍晚期的加工中,杏仁核对威胁性面孔的反应依赖于注意的调节。
第三,从注意捕获的角度讲,杏仁核不是情绪刺激捕获注意的关键脑区,注意对杏仁核的调节依赖于其他脑结构。最近的一项研究(Klumpp,Angstadt,& Phan,2012)发现,通过操作注意的指向可以分别调节杏仁核和扣带前回(anteriorcingulate cortex,ACC)的活动。研究者在同一视觉区域内同时呈现三联体的几何图形(圆形、正方形、三角形)和三联体的情绪面孔(愤怒、恐惧、高兴),在一半的实验组块中要求被试判断图形是否匹配,在另一半组块中要求被试判断表情是否匹配。结果表明,执行面孔匹配任务与执行图形匹配任务相比,杏仁核的激活更强,反之,ACC喙部(rostral)的激活更强。该研究通过调节被试的注意方向分别影响了杏仁核和ACC的活动,这暗示了杏仁核和ACC都是受注意调节的,而情绪信息对注意的捕获依赖于其他的机制。另外,一项对杏仁核损伤病人的研究(Piech et a1.,2011)以更为有力的证据表明,杏仁核损伤并不影响威胁性刺激对注意的捕获。该研究采用情绪性注意瞬脱任务(emotional attentional blink task)测量了注意瞬脱过程中杏仁核损伤病人和正常被试对目标反应的准确率,结果无论左侧还是右侧的杏仁核损伤都不影响威胁性情绪刺激对注意的捕获,这表明杏仁核不是威胁性刺激捕获注意的执行者。
综上所述,杏仁核对威胁性刺激的加工分为不同的阶段。在加工过程的早期,杏仁核的活动不受注意调节,而在加工过程的晚期,其活动受到注意的调节。未来的研究还需要采用具有较高时间分辨率的技术进一步确定杏仁核活动是否具有跨感觉通道的注意效应。此外,杏仁核不是威胁性信息捕获注意的关键脑区,其功能主要是对刺激与当前动机的一致性进行评估(Cunningham &Brosch,2012)。在杏仁核对刺激进行评估之前,威胁性信息已经捕获了注意。因此,威胁性信息捕获注意的机制应该在杏仁核之前的加工通路中寻找。
3 威胁性信息检测的神经通路
近年来关于威胁性信息检测的研究描绘出一幅双通路检测的图景:杏仁核的早期加工接受皮层下通路的信息输入,而后期受注意调节的加工接受皮层通路的信息输入。
3.1 威胁性信息检测的皮层通路
皮层通路能够对威胁性信息进行精细加工,是威胁性信息检测的重要机制(Pantazatos,Talati,Pavlidis,& Hirsch,2012a,2012b)。迄今为止,已经发现事件相关电位(event-related potential,ERP)中的Cl成分、视觉皮层中神经元的gamma波振荡(oscillation)等均对威胁性刺激表现出敏感性。
ERP中的Cl成分是初级视觉皮层(primaryvisual cortex)活动的重要指标,当刺激呈现在视野上部时,C1受到注意负荷的调节(Rauss,Pourtois,Vuilleumier,& Schwartz,2009)。Eldar,Yankelevitch,Lamy和Bar-Haim(2010)使用ERP技术考察了焦虑障碍(anxiety disorder)患者对威胁性刺激的注意偏向。通过对焦虑组和正常组进行比较发现,当线索中包含威胁性面孔时,焦虑组被试的C1成分(出现在刺激呈现后约80 ms)的波幅显著增大,而在任何情绪条件下都有P2波幅的增大。其中,C1对威胁性刺激的特异性反应说明早期视觉加工跟威胁性刺激的注意捕获有一定的关系。此外,Peyk,Schupp,Keil,Elbert和Junghofer(2009)运用重复呈现技术测量了大脑对情绪刺激的响应间隔。他们发现对情绪唤醒敏感的ERP成分——早期后部负波(early posteriornegativity,EPN)能够对呈现频率不高于12Hz的情绪刺激作出响应,也即视觉加工需要大约80ms的时间来编码情绪刺激。与C1的潜伏期非常接近。
Jensen,Kaiser和Lachaux(2007)总结了神经振荡方面的研究,首先明确指出神经活动在gamma波段(40-100 Hz)的同步化(synchrony)和去同步化(desynchrony)在注意、工作记忆等复杂的认知加工中起到重要作用。Rotermund,Taylor,Ernst,Kreiter和Pawelzik(2009)在对非人灵长类动物的研究中发现视觉皮层中gamma频率的神经活动能够易化对注意到的刺激的知觉,gamma波能量的变化与行为反应的成绩呈正相关。Sokolov,Pavlova,Lutzenberger和Birbaumer(2004)在人类被试中发现了类似的效应:注意刺激诱发视觉皮层中gamma波活动的增强,非注意刺激使gamma波活动减弱;这说明Gamma波的活动可能跟选择性注意的两种机制有关,一是对注意刺激的强化,二是对干扰刺激的抑制。此外,具有较高时间和空间分辨率的MEG为研究gamma波的活动与威胁性刺激检测的关系提供了有力的支撑。Luo等的研究指出,在威胁性刺激呈现后250 ms内视觉皮层和杏仁核的gamma波能力升高是不需意识参与的,即阈下和阈上的威胁刺激同样能引起gamma波活动的增强(Luo,Holroyd,Jones,Hendler,& Blair,2007;Luo et a1.,2009)。而Maratos等(2012)则发现,在威胁性刺激呈现后50-250 ms的时间窗口内,纹外皮层(extrastriate cortex)的gamma波活动减弱。虽然这些研究都检测到了gamma波对威胁性刺激的响应,但具体的机制还需要进一步澄清。
此外,来自fMRI的证据也表明,威胁信息的检测涉及一条通往杏仁核的皮层通路。Han,Gao,Humphreys和Ge(2008)研究了大脑对潜在社会威胁的检测。结果表明,对社会性威胁线索的加工涉及额叶的内侧和外侧(medial and lateral frontalcortex)、顶上小叶(superior parietal lobes)、颞中回后部(posterior middle temporal gyrus)及小脑(cerebellum)等皮层结构。Larson,Aronoff,Sarinopoulos和Zhu(2009)利用具有威胁性特征的简单几何图形诱发了威胁检测相关脑区的活动。威胁性图形的识别激活了杏仁核、梭状回(fusiform gyms)和颞上沟、颞上回,杏仁核又自上而下地影响了视觉区的活动。作者认为,这一神经回路是威胁性信息的有效检测的重要结构。
具有较高时间分辨率的脑电和脑磁研究结合具有较高空间分辨率的磁共振研究证明了枕颞部的多个皮层结构能够对威胁性信息进行快速检测,但这并不是说皮层通路是威胁性信息传人杏仁核的唯一路径。那些初级视觉皮层受损的盲视病人的杏仁核仍然能够对恐惧面孔作出快速响应(Pegna et a1.,2004),这表明杏仁核对威胁性信息的加工可能涉及一个皮层下通路。
3.2 威胁性信息检测的皮层下通路
杏仁核除了接受感觉皮层的投射之外,还接受来自皮层下结构的直接投射,这些皮层下回路被认为是信息快速加工的通道(Morris,Ohman,&Dolan,1999)。一些研究发现,视觉皮层损伤的病人仍然能准确猜出视觉目标的位置。对这些病人的研究发现了一条从脑干(brain stem)经过上丘(superior colliculus)和枕核(pulvinar nucleus)到达杏仁核的快速视觉加工通路(Weiskrantz,Warrington,Sanders,& Marshall,1974)。这条皮层下通路是杏仁核在无意识状态下加工视觉刺激的直接通道(Morris et a1.,1999),因而可能在威胁性信息检测中发挥重要作用。
脑干是一个具有进化适应性的警觉系统(Liddell et a1.,2005)。在脑干中,蓝斑(locuscoeruleus)是上行激活系统的重要组成部分,它不仅能保证大脑相应区域的充分唤醒,在注意的捕获和危险信号的定向中也发挥重要作用(Williams,2006)。脑干的感觉神经核能够对刺激的视觉信息进行粗糙的加工,这些粗糙的信息结合蓝斑的唤醒功能可以使得个体对威胁性信息产生注意警觉(徐晓东,刘昌,2008)。经上丘向枕核的信息输入能够调节眼跳(saccade)并补偿眼跳偏移(Berman& Wurtz,2011),同时也是调节视觉注意的重要回路(Petersen,Robinson,& Morris,1987)。而眼跳和视觉注意都在威胁性信息检测中发挥重要作用(Bannerman,Milders,& Sahraie,2010;Flaisch,Schupp,Renner,& Jungh6fer,2009)。一些解剖损伤的研究为揭示上丘和枕核的功能提供了有力的证据。比如,Maior等(2011)使用神经毒素阻断卷尾猴的双侧上丘一杏仁核传输通路,结果卷尾猴对橡胶蛇不再产生恐惧知觉,表明上丘在威胁信息的知觉中起到关键作用。Arend,Rafal和wlard(2008)对枕核损伤的病人进行了注意力检测,发现枕核前部损伤的病人表现出空间注意的缺损,而枕核后部损伤的病人表现出时间注意的缺损:这表明枕核是调节时间和空间注意的重要结构。此外,磁共振研究也证明“上丘-枕核-杏仁核”这一皮层下的警觉系统在威胁性信息检测在发挥重要作用(Liddell et a1.,2005;Tamietto & de Gelder,2010)。这些研究充分表明,由中脑至杏仁核的皮层下通路是对威胁性刺激进行快速识别和检测的重要回路。
然而,皮层下通路对刺激特征的加工是粗略的,这使得不确定性信息往往也被认为是威胁性信息,从而引起杏仁核的活动(Rosen&Donley,2006)。对威胁性刺激的准确识别必须依赖视觉皮层的加工。因而,对威胁性信息的检测涉及一个速度与准确性权衡的问题,必须依赖皮层下通路和皮层通路的合作。3,3
皮层通路和皮层下通路的功能联结
大脑功能网络的研究为理解心理活动的脑机制提供了崭新的思路(Bassett&Gazzaniga,2011)。对威胁性信息加工的脑网络的研究描绘出一幅与单一脑区分析截然不同的画面。Pantazatos,Talati,Pavlidis和Hirsch(2012a)对非注意情境下的威胁刺激加工的脑结构进行了功能联结分析。他们发现颞上沟(superior temporal sulcus,STS)与枕颞区(temporo-occipital)、顶颞区(temporo-parietal)及小脑的功能联结对于阈下威胁的加工非常重要。此外,右侧杏仁核与右侧楔前叶(precBneus)的联结增强,而双侧杏仁核的联结减弱。同时,阈上的威胁面孔加工所涉及的颞上沟、颞中回等结构(Haxby,Hoffman,&Gobbini,2002;Sabatinelli eta1.,201 l;Said,Moore,Engell,Todorov,&Haxby,2010)也参与到非注意的威胁刺激的加工中来。这说明,皮层通路对威胁性刺激的检测比皮层下通路更加重要(Pessoa&Adolphs,20tO)。在另一项研究(Pantazatos,Talati,Pavlidis,&Hirsch,2012b)中,Pantazatos等发现STS和MTG之间的信息交流在阈上的威胁信息的加工中起到重要作用。对于阈上和阈下的威胁信息检测进行比较发现,角回(angular gyrus)和海马(hippocampus)之问的功能联结对阈上的威胁刺激检测非常重要,右侧杏仁核对阈下威胁信息的检测更加重要;而无论对于阈上还是阈下的威胁信息的检测,都与丘脑(thalamus)的活动有关,当威胁信息被注意到时,丘脑与MTG/STS以及脑岛的联系增强。
由此可见,皮层结构和皮层下结构在威胁性信息检测中的作用是有区别的。这一区别不在于某一脑区功能的变化,而在于不同脑区之间功能联结的紧密程度的变化。这表明,参与阈上和阈下的威胁信息加工的大脑通路是不同的,同一通路中传递信息的量也是不同的。但不同的通路传递了何种信息,刺激特征如何影响信息在不同通路中的权重,以及注意对不同通路联结强度的影响等问题还需要深入研究。4总结与展望
对威胁性信息的检测是有效处理危险的前提条件。威胁性信息的检测涉及到皮层通路的准确加工和皮层下通路的快速加工,两条通路中的信息存在着竞争、整合与权衡的问题。杏仁核接受两条通路的信息并对其重要性进行评估,同时受到高级认知的调节,完成对威胁性信息的检测。由于杏仁核能够接收多感觉通道的信息输入,并在刺激加工的不同阶段表现出不同的特性,因而成为理解威胁性信息加工的核心脑区。然而,不同通路中的信息如何竞争与整合,加工速度与准确性如何权衡等威胁性信息检测过程中的核心问题仍未得到解决,未来的研究需要从以下几方面入手,充分探索威胁性信息检测的脑机制。
第一:需要以杏仁核为节点,对皮层通路和皮层下通路的信息整合进行研究。虽然威胁性信息通过两条通路进行检测受到了大多数研究的支持,但是这两条通路的信息是如何在时间和空间上进行整合的还不清楚。从时间上讲,皮层通路也能够在极短时间内对威胁性信息进行检测,其加工过程与皮层下通路几乎是同步的,并能够在杏仁核受到注意调节之前把信息传入杏仁核。从空间上讲,两条通路分别与不同的大脑结构进行联结,引起不同的行为反应,同时它们对客体特征加工的静息程度不同。如此复杂的信息在进入高级脑功能区之后必须得到整合才能引起合理的行为反应,因此,理解信息整合的机制是明确威胁应对机制的前提。
第二:需要在脑网络中研究杏仁核的功能。杏仁核不仅是不同感觉通路信息汇聚的地方,也是自上而下调节的关键环节。然而,并非所有上下的信息流都经过杏仁核,杏仁核在威胁性信息的加工也不是最终的调节器(SMzman & Fusi,2010)。对威胁性信息加工网络的完整了解是正确理解杏仁核功能的充分条件,同时,也是理解人类如何应对威胁的必由之路。
第三:对视觉之外的其他感觉通道的威胁信息检测的研究还不多,其具体机制尚未阐明。一方面,其他感觉通道如何独立地检测威胁信息,是否也像视觉一样存在快速和精确加工的权衡?对于各感觉通道工作模式的了解有助于我们理解威胁信息检测的一般机制。另一方面,各感觉通道是如何相互协作的?威胁信息的检测是否存在感觉通道之间的迁移?对多感觉通道的整合研究可以提供威胁信息处理的神经网络的完整信息。
神经网络中的注意力机制范文6
[关键词]媒介记忆 浅层记忆 深层记忆 底层记忆
[基金项目]本文为浙江省社会科学重点研究基地传播与文化产业研究中心课题《媒介如何打造我们的记忆:媒介记忆与社会记忆互动关系研究》(ZJ08Y03)成果之一。
对于个人记忆的剖析是理解自我的一种探索,是揭示个体独特性和内在秘密的一次探秘之旅。个人记忆作为个人接受外界讯息并保存讯息的心理现象,作为其他记忆研究的基础,医学家、心理学家、社会学家和教育学家等研究者已经在这个领域进行了大量的研究,研究范围也不断向外扩展。法国社会学家Maurice Halbwachs首先提出“集体记忆”(collective memory)的概念,德国古埃及学家Jan Assmann则率先对“文化记忆”(cultural memory)进行研究,随后有学者提出了“公共记忆”(public memory)、“社会记忆”(societal memory)等不同概念。
“媒介记忆”(meida memory)是作为媒介研究与记忆研究的交叉领域而提出的概念,试图从中探讨在媒介运作中媒介是如何通过扮演一个记忆角色来完成与社会其他领域的互动过程。[1]2011年,以色列奈塔亚学院和海法大学的Motti Neiger、Oren Meyers和Eyal Zandberg 三位学者第一次将媒介记忆领域的相关研究论文编撰成书,试图更为系统地研究媒介记忆的场域以及媒介记忆与集体记忆之间的交互关系。[2]就研究目的而言,学者们通过对于不同类型记忆的划分,强调记忆在不同领域中有着各自的特性与关联。而不同概念运用的本身也包含着使用者对于不同的侧重点的关照。然而,无论如何扩展,不同类型的记忆研究始终是以个人记忆为基础单元的延伸与拓展,而媒介记忆正是建立在个人记忆基础之上的一种集体记忆,是个人记忆的升华和集体记忆的固化。
教育学家与心理学家们一直致力于个人记忆内在运作机制的研究工作,并期望通过这样的研究让信息的传递与记忆能够更为高效。澳大利亚学者John Sweller在经过30年对大脑信息处理运作模式研究后得出,个人记忆有着两种截然不同的记忆功能并存于人的大脑之中:短期记忆和长期记忆。我们把即时的印象、感觉和思考作为短期记忆存放,这些记忆内容通常只能维持几秒钟。我们对这个世界的所有认识,无论是有意学到的还是无意学到的,都会以长期记忆的形式保存,这种记忆可以在我们的大脑中保存几天、几年甚至一辈子。而这两种记忆功能之间可以根据实际应用情况的不同相互转化和调用。[3]媒介记忆的内在运作机制同个人记忆的内在运作机制有着几乎相同的特点。因此,我们同样也可以按照个人记忆的特点,将媒介记忆划分为浅层记忆(短期记忆)、深层记忆(长期记忆)、底层记忆(核心记忆),并通过这三个维度来研究媒介记忆的内在机制、传播功能和运作镜像。
一、媒介记忆的内在运作机制
人类的感知器官是大脑采集信息的重要渠道。我们全部感官信息输入的90%是通过视觉来实现的,人的视觉虽然能延伸到大约180度,但是只有视线90度范围内或20英寸球半径内的图像分辨率较高,另外90度的图像信息并不清晰,听觉等感知器官的分辨率也是如此。就是说人的感知器官对外部信息的接收和采集是选择性的和有局限的,其在第一次采集与遴选过程中就将大量有价值或无价值的外部信息进行筛选了。媒介作为“人体的延伸”和人造之物,媒介记忆与个人记忆的机制大同小异,媒体记者按照自身的价值和认知标准从社会信息中采集、加工和制作文本,媒体的守门人再将文本信息予以选择性编辑和传播,进入媒介浅层记忆(图1)。
媒体日复一日、连续不断生产和更新的媒介产品首先形成的是媒介浅层记忆(短期记忆)。按照媒介生产周期不断被采集遴选出来的新闻、娱乐信息产品传播给受众之后,在受众有限的时空中是短暂的不停留的。报纸、期刊、广播、电视和新媒体不断刷新着自己的信息内容,就如同个人记忆中的短期记忆一般,形成一种即时的印象、感觉和思考,随后立即有新的信息填补进来,旧的信息则消失在浩如烟海的信息大潮中。只有进入媒介浅层记忆的部分信息才能通过物质层面和精神层面两种渠道的转化进入媒介的深层记忆(长期记忆)和时空隧道,同后代交流。
媒介深层记忆具有长期性,从物质层面讲,它是媒介浅层记忆的档案化、积淀化和历史化。媒介产品从一种即时消费的信息产品变成了一种具有社会价值、历史价值和研究意义的文献资料存储档案。在精神层面,媒介周而复始的短期记忆生产和处理过程逐渐沉淀进入媒介深层记忆之中,于是零散的浅层的记忆信息被有组织地排列起来,形成了某种经验的或理论的复杂概念,或者说形成了一种“图式”和“框架”。因此,无论是物质层面的档案化的深层记忆或是精神层面的理论化的深层记忆,在以后的传播运作中,它们都会对新的媒介浅层记忆的激活、生产和创造构成影响,从而形成浅层记忆与深层记忆之间的互动过程,让信息内容更加饱满。
媒介的底层记忆(核心记忆)是承载着一个民族的价值观念和文化的基因密码,就如同个体记忆存储于我们基因中的信息。从某种意义上说,我们的记忆决定“我们是谁”,而这其中绝大部分是由基因决定的,是基因决定了我们能成长为怎样的人,也决定了我们能适应怎样的自然规律。[4]媒介底层记忆同人的底层记忆一样,它深处媒介内在运作机制的最底层,决定了不同媒介具有不同的特点与功能,决定了不同媒介的外在表象和内在机制,使不同媒介能够适应社会的不同需要,当然不同媒介也具有不同的浅层记忆与深层记忆的运作过程,内蕴着不同的媒介素养、专业精神和媒体愿景等抽象的核心信息。
二、媒介浅层记忆周期
个人记忆中的浅层记忆是一个非常短暂的过程,它可能仅仅维持几秒钟,也可能稍长,但无论如何它与遗忘相伴。正如德国心理学家艾宾浩斯(H·Ebbinghaus)研究发现的,短期记忆的遗忘速度呈现先快后慢的趋势,大部分信息在被大脑接受的一个小时后就从记忆中消失了。根据实验结果,他将其描绘成人类遗忘进程的曲线,即著名的“艾宾浩斯记忆遗忘曲线”。媒介浅层记忆的周期也符合这一记忆遗忘曲线的规律,“麦当劳化”的快速生产、快速遗忘成为当下媒介浅层记忆的重要特征。当然,媒介浅层记忆周期也有着自身的特点和规律。媒介机构毕竟不同于大脑有机体有着一个自然的信息更替过程,媒介浅层记忆还要受到媒介产品的生产周期、媒介议程设置周期、受众兴趣周期以及经济政治等因素的影响,从而可能在一定程度上压缩或延展媒介浅层记忆的周期或曲线(图2)。
首先,媒介浅层记忆周期会受到媒介产品生产周期和生命周期的影响。就媒介产品的生产和传播而言,它本身就是一个信息的更新与更替过程,报纸不可能两天刊载同样的新闻,广播电视也不可能无限期地播放相同的节目。媒介产品短暂的“保质期”促使媒介产品的生产过程保持在严格的周期之内,从而在某种意义上决定了媒介浅层记忆的转化周期。媒介产品具有从引入期、成长期、成熟期到衰退期的一个S型生命周期曲线,而不同媒介产品的生命周期也会长短不一,特点各异。[5]但不论不同媒介和不同媒介产品之间的生命周期与生产周期有多大区别,它们都遵循从进入媒介视野到逐渐淡出媒介视野的S型生命周期曲线。而这一曲线恰恰是媒介浅层记忆的第一层影响因素,也是决定性因素。媒介的生产周期决定媒介记忆的保留周期。日报每日一期地更新内容,杂志每周或更长周期完成内容和记忆的更新过程,广播电视媒介同样如此。时段的变化与内容的更替就是一个记忆的刷新过程,在这一过程中,刚刚生成的媒介记忆迅速地被新进入的信息记忆所替代。网络新媒体中的信息传播与接受虽然没有强制性的退出机制,或者说没有像传统媒体那样鲜明的周期曲线和更替机制,但是为了保证对受众长期的和持久的吸引力,网络新媒体的记忆代谢速度和频率显然要比传统媒体更为快捷。
其次,议程设置的时间周期也是一个重要的影响因素。如果说媒介产品的生产与生命周期是媒介浅层记忆周期的客观因素,那么议程设置就是媒介浅层记忆中的人为因素。Maxwell Mccombs指出,议程设置的作用就是媒介通过对新闻筛选、编辑、编排来影响公众对社会与政治议题的关注,而日复一日地重复某个议题,正是其具有重要性的最有力证明。[6]从媒介记忆的角度来理解,议程设置形成最大效果的重要途径,就是人为地调控哪些信息在媒介浅层记忆中可以停留更长时间和停留在怎样显著的位置之中。议程设置的过程其实就是一场零和博弈。媒介浅层记忆在时间与空间上是相对有限的,报纸上的空间有限,广播电视的时间有限,网站虽然在表面上拥有无限容量但同样受到受众注意力维持时间与公众拥有的空间等因素的影响。因此,在媒介的浅层记忆中某些信息被记忆或记忆的周期被人为延长,同时也就意味着另一些信息被忽视或被选择性遗忘。
如何设置议题,是从幕后走向台前的过程,是完成从浅层记忆走向深层记忆的一个路径。即使媒介可以人为地设置议题和决定浅层记忆中信息停留时间,但对于受众的影响程度或者说议程设置的效果终究要经历一个逐渐降低的过程。Wayne Wanta 和Y. Hu通过对五家不同类型的新闻媒体调查后得出结论,媒介公共议程能够产生最佳效果的匹配时间范围从一周到八周不等,平均时限也不过是三周时间。[7]这就是说,人为的议程设置在媒介浅层记忆中的影响同样受到时间因素的影响,同时带来了另一些媒介记忆的选择性遗忘。
第三个影响因素是媒介受众兴趣周期。今天受众对媒介信息喜好或关切的兴致或情绪在不断迁移,兴趣周期在逐步缩短,信息记忆的新陈代谢或更替变化的速度在加快。
对于网络偶然性事件的研究表明,从受众自发的开始关注某一信息到兴趣逐渐减弱直至消失同样遵循着S型曲线的规律,这与艾佛雷特·M·罗杰斯的“创新扩散理论”(Diffusion of Innovations Theory)颇为类似。受众对于信息的关注从缓慢递增快速递增缓慢递增直至越来越少的成员加入到采纳者的行列。不同的是,在大众传播中受众兴趣的转移与更替速度更是惊人。在研究的案例中,对偶然性事件的关注,在快速增长期仅仅持续两天就进入了缓慢递增阶段,随之开始逐渐远离受众视野。[8]在进一步针对网络舆论运动的研究中也发现,虽然媒介信息中矛盾尖锐、热点纷呈,但网络舆论运动依然呈现出一种类似波浪运动的特征,在持续数月的媒介关注之下,受众的情绪与兴趣也如同波浪一样,一旦没有新的信息刺激,受众兴趣就急剧衰减。因而,舆论呈现出一种波浪式的起伏特征,随着新的舆论热点的加入,旧的记忆信息迅速回落,紧接着是新一轮的起伏。[9]在新媒体信息周期的研究中更有惊人的发现,当新媒体信息后,其效用价值会在较短的时间内迅速达到最大值,然后在较长一段时间内逐渐衰减,趋近于零,而这个较短时间平均不到两小时。[10]
总之,三组研究都从不同侧面证明,媒介的浅层记忆周期与受众兴趣的衰减有着紧密的联系。尽管媒介可以人为调控受众浅层记忆的关注时长,但是没有新信息的介入,在经历了短期关注之后,受众兴趣的转移或更替仍然直接导致媒介寻求新的热点。随着新媒体的介入、碎片化传播方式的使用、信息干扰和快速更新,媒介的浅层记忆周期变得越发短促。
第四,经济、政治的影响因素。没有一个媒介系统可以脱离经济、政治等外在环境的影响而独立运作。国家和政府的政治控制是影响媒介记忆的主要因素。这种控制的目的是通过制定媒介体制、法律、法规和政策来保障媒介记忆,为国家制度、意识形态以及各种国家目标的实现服务。政治决定社会信息的采集遴选过程,决定媒介浅层记忆的时长和周期,经济也可以在一定程度上延长或缩短信息在媒介浅层记忆中的停留时间。譬如,企业可以通过广告形式购买有限的媒介时间或空间以达到自己的宣传目的,也可以通过经济手段封锁某些不利消息的传播,使其在媒介浅层记忆中尽快消失。
三、媒介深层记忆互动机制
认知神经学家在个人记忆研究中发现,大脑对于长期记忆的提取过程是极其壮观和高效的。当别人跟你提到“跑车”的一瞬间,你并不需要真的看到那辆跑车,你的大脑就已经开始如涌潮进入河网般的被调动起来,如同一场突然达到的交响乐,在神经网络中产生了巨大的同步震荡波,瞬间席卷数百万个神经元,分别存储在大脑中关于跑车的视觉记忆、空间记忆、听觉记忆、触觉记忆、情感记忆同时出现,相互交织,形成一个你对跑车的整体印象。而这一反应正是个人记忆中长期记忆与短期记忆、新记忆与老记忆之间的互动联系。Paul Levinson认为,媒介演化过程就是一个“人性化趋势”(anthropotropic)的过程,媒介技术开发的趋势就是越来越像人,是技术在模仿、复制人体的感知模式和认知模式。[11]媒介在物质层面的深层记忆也是如此,媒介技术更新的目的就是为了让信息的存储与调用更加高效化、便捷化和人性化。
物质层面的深层记忆是档案化和历史化了的媒介短期记忆,是媒介产品从信息消费品到信息存储品的转化。但是,这些深层记忆绝不仅仅是为了研究或是历史价值而保存的,某种程度上它也是新记忆与旧记忆之间的交结与互动,旧事物总能帮助人们加深对新事物的理解和认识,而这些时刻准备着被提取的深层记忆也在等待着与新的浅层记忆进行新一轮互动,从而在互动中增加自己的价值。媒介记忆在技术层面的数字化进程使得存储过程变得更为便利,而搜索引擎过滤等技术发展则使得信息的调用与提取变得更加方便、高效。但是,十余年媒介数字化发展,仍有大量媒介深层记忆留存在传统的存储介质(如纸张、磁带、磁盘、胶片)之上,如何更高效、快捷地保存和调用这些记忆是一个亟待解决的问题。同时,传播空间和搜索技术的局限,也在一定程度上影响了非文字符号即图片、图像记忆的存储和调用效率。[12]另外,媒介技术的开发与运用有时可能还跟不上媒体人的变化与流动,在媒体液体化的大背景下,媒体员工的较高流动性和媒介系统年轻化的趋势已使得媒介深层记忆的保存与调用阻碍重重,新员工总是无法完全了解过去记录下的一切。媒介对于自身记忆资源的忽视和媒介深层记忆责任感的缺失,也使媒介深层记忆在物质层面陷入了一种极为低效的互动状态。
与物质层面的深层记忆不同,精神层面的深层记忆所存放的不只是事实,还是一个认识与理解的空间。媒介中大量零散的浅层记忆经过积累逐渐上升成为经验,而经验又进一步上升成为理论,进而逐步形成在精神层面上对媒介浅层记忆运作机制的有意识引导。从20世纪20年代初,布莱耶、哈里·F·哈林顿、格兰特·M·海德、M·莱尔斯·斯潘塞等人开始编写第一批新闻学教材以来,媒介这种有意识的专业化教育已经开展了近百年,这也说明有组织、有意识的采访写作指导对于新闻深层记忆起着至关重要的作用。而所谓无意识的引导则是一种在媒介记忆运作过程中周而复始所形成的约定俗成式的习惯性操作,并形成媒介框架,成为“一种认识、阐释、成熟的持久稳固的方式,也是挑选、强调和剔除的依据,通过框架,符号操作者只需例行公事地组织符号,无论是语言还是视觉的”。[13]它是符号工作者长期组织言说(包括口语和视觉)的过程,长此以往形成固定的认知、解释与呈现型态。[14]媒介系统中的从业者们从一开始接受有意识的媒介训练,随之周而复始的浅层记忆积累使他们成了流水线工人般的无意识“敲打”。当然这种无意识的引导并非独立运作的,媒介深层记忆中的这种有意与无意的引导的转换往往就在一念之间,彼此交织,共同发挥着作用。
四、媒介底层记忆的内驱机制
达尔文理论认为,环境对有机体的影响,是在有机体与环境接触以后才产生的。如果有机体存活并繁殖,它所传承的基因所生长的形状就与原有的环境协调了。这也就意味着基因中所传承的记忆信息绝不是任意的,这种复杂的信息编码背后,起码是一种有机体胜利或未被击败的“典范”。由此,Paul Levinson得出观点,媒介技术的发展与更替,与基因和自然选择的偶然性有着一定的可比性。[15]
对于媒介记忆的内在运作机制而言,它与时下不断更新发展的新媒体技术不同,它已经是经过了数百年自然选择和优胜劣汰后所传承下来的成功典型,而这一“典型”正是由其媒介底层记忆信息或基因所组构的。就像基因信息解码后,它决定着构成整个有机体的蛋白质的排序,媒介底层记忆同样决定着什么样的一群人聚集在一起,以怎样的组织形式共同达成怎样的目标和完成怎样的任务。在媒介记忆的运作层面,媒介底层记忆是一种发自所有媒介组织机构和媒介从业者个人内部的驱动机制,它决定着媒介组织的自我认知、如何自处于社会,媒介从业者应当秉持怎样的共同意识与价值进行有序的信息采集、处理和记忆流程,应当通过何种路径和手段避免媒介失忆。
注释:
[1]Carolyn Kitch.Chapel Hill.Pages of the Past:History and Memory in American Magazines,University of North Carolina Press,2005
[2]Edited by Motti Neiger,Oren Meyers and Eyal Zandberg,On Media Memory Collective Memory in a New Media Age,Palgrave Macmillan Memory Studies,Palgrave Macmillan,2011
[3]John Sweller,Instructional Design in Technical Areas,Camberwell,Australia: Australian Council for Educational Research,1999
[4]Howard Eichenbaum,The Cognitive Neuroscience of Memory: an Introduction,Oxford University Press,2002
[5]邵培仁:《媒介管理学》,高等教育出版社,2002
[6]Maxwell McCombs,Setting the Agenda:The Mass Media and Public Opinion,Polity 2004
[7]Wayne Wanta and Y. Hu,"Time-lag difference in the agenda setting process;an examination of five news media",International Journal of Public Opinion Research,6(1994)
[8] 邵慧:《网络媒介中的偶然性事件传播》,《当代传播》2007年第2期
[9]廖卫民:《突发公共事件中网络舆论传播特征》,《新闻前哨》2010年11期
[10]马费成、夏永红:《网络信息的生命周期实证研究》,《情报理论与实践》2009年第6期
[11]Levinson,P.(1979).Human replay:A theory of the evolution of media(Doctoral dissertation,New York University,1979).Dissertation Abstracts International,40,03A:1136
[12]邵鹏:《媒介失忆:数字技术光环下的“信息黑洞”——“短命”的网络脚注触发的警报》,《新闻记者》2009年第1期
[13]Gans, H.Deciding what's news. New York: Harper and Row/ 1979:7
[14]Pan,Z.& Kosicki, G.M. Framing analysis:an approach to news discourse, Political Communication. 1993,10:56