前言:中文期刊网精心挑选了人才测评论文范文供你参考和学习,希望我们的参考范文能激发你的文章创作灵感,欢迎阅读。
人才测评论文范文1
关键词心理学;方法论;应用研究
分类号B849
DOI: 10.16842/ki.issn2095-5588.2017.04.008
1引言
当前国家和社会对心理学的应用需求前所未有,心理学的学科和专业教育也对应用心理学、心理学的应用研究提出了新的要求,在这一背景下,无论是研究者还是学术期刊都要顺应时展潮流,承担起心理学“改变现实”的使命。
2017年初,《心理技术与应用》了“改变现实的心理学”专题论文征稿启事,征集关于社会热点问题的心理学“研究快报”“评论文章”,以及将心理学原理、方法、技术运用于各行业领域或日常生活的应用方案或实际案例、咨询报告或政策建议等。之所以征集这类投稿,是要强调心理学在改变和改善现实方面的重大使命,推动心理学研究成果在国家政策、企业管理以及个人生活等层面的应用。这种征稿导向是办刊定位的要求,《心理技术与应用》定位为一本应用心理学专业学术期刊,发表各应用心理学领域的前沿学术研究成果,尤其是运用心理学原理、方法和技术探讨经济、社会、管理、健康、教育等领域现实问题的原创性研究成果。在《心理技g与应用》2016年第4期我撰文阐述了这一定位,强调我们要发表那些“旨在‘理解’并(或)‘改善’的应用心理学原创研究成果”(辛自强, 2016, p194)。
无独有偶,《心理学报》2016年5月公告,设立“以小拨大:行为决策助推社会发展”专栏并征稿。该专栏旨在立足中国现状,集中报告既有用又有趣的行为决策研究发现,重点评介这些充满奇思妙想的发现在提升人民的健康、财富、幸福等领域可提供的“小”技法和可发挥的“大”作用。
行为决策无疑是应用研究的重要领域,不仅如此,整个心理学都面临着“现实转向”的问题(林崇德, 辛自强, 2010),必须更多关注我国经济社会发展的现实需求。心理学只有承担起“改善现实”的使命,才能展现出自己的力量和价值,才能获得更广阔的发展空间。
实际上,我国的研究生教育已经开始因应这种现实需求,大力发展专业学位教育。现在全国有60多个单位可以招收应用心理硕士专业学位研究生(简称“应用心理”专硕),专硕教育蓬勃发展。例如,我所在的中央财经大学自2015年招收第一届应用心理专硕以来,每年考录比均超过10比1,一跃成为学校最热门的专业之一。这些年在推进并不断反思专硕教育的过程中,我们发现,不仅是教学要适应专业学位教育的需求,而且更重要的是,整个心理学都面临挑战:若没有现实的关怀,不能承担“改善现实”的使命,心理学就难以获得持久的生命力。
虽然2010年我的恩师林崇德先生和我曾经撰文讨论过发展心理学的“现实转向”问题,但我又历经几年才开始慢慢领悟,心理学现实转向的最大难点是方法论的转向和变革,只有在方法论层面改变心理学研究当下一些未必妥当的习惯模式,才可能真正实现学科的现实转向。改变“现实的心理学”,才可能有“改变现实”的心理学。要开展旨在改变现实的心理学研究,我们需要在方法论层面做哪些变革呢?本文略述管见以抛砖引玉。
2八个方法论问题
(1)研究的价值导向
研究通常被区分为基础研究与应用研究,前者侧重回答“是什么”“为什么”的问题,寻求描述、预见、特别是解释性的知识;后者侧重回答“应该如何”“如何做好”的问题,旨在基于证据提出解决实际问题的行动方案或建议。就价值定位而言,前者以“求真”为导向,侧重提升人类对客观规律的“理解”;后者以“至善”为导向,帮助人类依循客观规律改变或改善现实。不理解客观规律,就难以有效改变现实,反之,以改变现实为目标的研究,也推动着对客观规律的探究,因此,二者相辅相成。
然而,只是讨论二者的辩证关系可能于事无补。当下的现状是:基础研究和应用研究之间存在巨大的差异,旨在理解的学问和旨在改变的学问之间存在巨大的鸿沟。这种鸿沟是学科历史和知识发展逻辑的结果,但很大程度上,也是偏见、学术评价体系造成的。心理学从创始人冯特开始,就充满偏见,冯特将心理学定位于基础科学,反对弟子研究应用问题。1879年冯特建立实验室这个事件,严格讲,只是标志着实验心理学的开端,把它当成整个“科学心理学”的开端,似乎显得实验心理学有些傲娇。发展心理学、应用心理学的很多分支学科,都有各自相对独立的学科起源和历史。以心理咨询为例,虽然它要从心理学这一母体学科中汲取学术营养,但是它走上了相对独立的发展轨道,表现为形成了独立的知识体系、研究范式和师承关系。
无论如何,现在是改变彼此偏见的时候了,我们应该认识到“理解”与“改变”的学问之间内在的逻辑联系(辛自强, 2015)。在历史发展过程中,心理学的应用价值一再被提升到新的高度,正是巨大的应用空间,不断为心理学开辟了新的发展道路。我们做基础研究的人应该向做应用研究和应用工作的人表达充分的敬意,因为他们可以直接改变现实,让世界和生活变得更美好。反过来,没有对客观规律的“理解”,就无法合理地、系统地进行“改变”。心理学家卡尼曼因为对人类决策心理的研究获得了诺贝尔经济学奖,但他与合作者都承认,他们研究的那些规律小商小贩早就在应用。然而,是他们这些学者让我们明白了小商小贩是如何进行经济决策的,没有他们的基础研究工作,我们就无法理解人类决策的本质,也谈不上有意识地用以指导决策。在应用工作中被个体自发使用的知识,只有被提炼、检验并系统化,才能成为自觉的知识,成为科学知识。今天,我们说哥伦布“发现”了美洲新大陆,但他“发现”之前,美洲大陆早就有人居住。虽然“发现”一词的使用,流露出些许的西方中心主义的色彩,然而,“是哥伦布把美洲大陆这个知识和人类科学的‘主流知识’联系在了一起。‘孤岛式知识’是不行的(万维钢, 2014, p239)。”
当前很多学术期刊已经试图推动基础研究和应用研究均衡发展,高校和科研院所的学术评价体系也日益兼顾旨在理解的成果和旨在改变的成果。就研究者个人而言,我们可以有所侧重,也同样可以兼顾两个方面。即便发表基础研究的论文时,我们也不应只是在论文“讨论”部分最后顺便提几句研究的应用价值了事,而是要更深入地思考我们的发现离实际应用究竟有多远,具体如何将自己的成果做“工程化”的转化。例如,我们可以要求专业硕士研究生在学位论文的研究一做一个小的基础研究,研究二将其结果转化为行动方案或项目,甚至实施该项目,并做项目评估。总之,我们要更多强调研究的应用价值,推动改变现实的研究。
(2)问题提出方式
研究始于问}。常用的问题提出方式有两种:有什么问题没有研究过?有什么实际问题需要解决?当前,我们往往只采用前一方式提出问题,而对后一方式考虑不多。
开展科学研究,必须思考并说明某个问题是否被研究过。科学的创新本质决定了研究者必须探讨新问题,用新的方法探讨问题,寻求新的发现。为了确定自己研究的创新性,要开展系统的文献综述,论证研究的新意,只要能证明自己的研究在某一方面超出了现有文献,就说明了研究的创新性和必要性。例如,很多论文的论证逻辑是这样的:关于变量A和B的关系已经被研究过,关于B和C的关系也有说法了,而关于A和C的关系,或者关于A、B、C三者的关系没有人研究,于是需要开展研究。对于纯粹的学术问题,我们确实可以这样提出问题。
然而,我们不能只从推导文献出发提出问题,还要从观察和反思现实开始提出问题,要不断反问“有什么实际问题需要解决”。大致有三个层面的涉及心理学的现实问题需要关注。一是重大社会现实问题。人类社会,尤其是中国面临大量的社会现实问题,如医患信任、农民工身份认同;除了负面问题外,还有很多是“如何变得更好”的问题,如民众获得感的增加、国民素质的提升等。二是各行业实践领域的问题。心理学可以广泛应用到有人类活动的各个部门、各个行业,包括政府与非政府机构、各类企业与行业、各类人群与团体。具体问题不胜枚举,如企业员工激励、投资心理分析、人才测评与选拔等。三是个人层面的问题。心理学更直接的应用是解决个人生活中的问题,如心理健康问题、智力开发问题等。
总之,我们的研究不能只是通过查阅和推导文献提出问题,而是要更多关注现实,研究实际问题,退而言之,至少要清楚地阐明所研究问题的现实立足点。现实问题可以是人类面临的普遍问题,也可以是我们国家面临的特定问题。所谓研究的“本土化”,就是要强调从中国实际出发,关注中国的现实问题,而非让研究停留在验证西方理论的层面。强调研究的应用导向和本土化思想是内在一致的。对我国当前的实际问题或现实问题提出新的理论解释,属于基础研究或应用基础研究;对实际问题的解决提出基于证据的思路和方案,这算作应用研究;若能直接开展行动来解决问题,则属于应用实践。应用研究应该是接地气的研究,接本土地气的研究。
(3)变量选择
我们鼓励旨在改变现实的研究,鼓励关于实际问题的研究,这就对研究方法提出了一系列新的要求。首先就是变量选择问题。我们认为,在一项心理学研究中既要有主观变量,也要有客观变量,因为心理学是研究主观变量与客观变量关系的科学。
心理学中的变量有两大类:主观变量和客观变量。主观变量是“心理”自身的、反映心理感受、心理活动等方面的变量,如情绪、推理等。客观变量来自三个方面:一是心理活动的产物,如行为表现、作业或作品、痕迹等,常用的变量包括行为发生情况(行为频次)、行为速度(反应时、问题解决时间)、行为强度(如博弈任务中的投资额度)、作业正确率或错误模式、作品质量、行为轨迹等;二是心理活动伴随的生理活动、生理表现方面的变量,如眼动特征、呼吸与心跳频率、腺体和血流特征、电生理特征(皮肤电、脑电等)、化学递质等;三是心理活动的外部条件,包括刺激特征(刺激的频次和结构、刺激的时间和强度、作业和任务类型)、环境条件等(如城乡背景、社会阶层、家庭结构、文化类型)。这三方面的客观变量,涵盖了心理活动的外部条件、行为和生理表现,笼统地说就是“刺激”(S)和“反应”(R)。
心理学是研究心理的科学,但鉴于心理变量本身是主观变量,被试心理无法直接由研究者观测(研究者可以对自身心理活动进行自我观测,但这容易陷入相对主义的窘境),只能通过被试的主观内省和自我报告(如口语报告技术、自陈量表)来测量。这种测量虽然可以直逼内心,但有很强的主观性。在这种局面下,心理学反而在客观变量的操纵和测量方面进展巨大,因为客观变量的测量在客观性、精确性上更符合心理学作为科学的要求。上个世纪初,行为主义者正是要用客观变量定义心理学的研究对象,用客观测量限定其研究方法。回顾心理学的历史可以发现,我们在客观测量方法方面已经有了长足进展,但相比之下,迄今为止主观测量方法的进展仍然乏善可陈。
不仅是测量方法问题,心理学研究要“有力量”,要担当改变现实的使命,必须考虑客观变量,要么研究对客观世界的主观感受,要么研究心理对客观世界的作用。例如,心理物理学探讨人们对各种物理量的主观感受问题,试图在物理量(客观世界)和心理量(主观世界)之间建立函数关系。这方面的研究结果往往具有很强的现实应用价值。卡尼曼的研究只不过是将心理物理学的研究方法应用于经济领域,探讨金钱的主观效用问题,但研究结果有很强的现实解释力和应用空间(如果卡尼曼只研究主观变量,他不可能获得诺贝尔经济学奖)。只有心理活动并不能改变客观世界,心理活动要藉由行为及其产物来改变客观世界,因此,我们要更多关注心理的行为表现、行为后果。总之,心理学研究要么关注心理的前因(客观刺激),要么关注心理的后果(行为),只有说明心理的前因与后果,才能得到有现实解释力的发现,才能让心理学研究“有力量”。
一言以蔽之,心理学是研究主观变量和客观变量关系的科学。没有主观变量不是完整的心理学(如早期的行为主义),只有主观变量是没有力量的、存在科学性风险的心理学。例如,现在很多研究所选的自变量和因变量都是主观变量,甚至再加个主观变量作为中介变量,如此统计来统计去,是很难说清其中的因果逻辑的。不仅如此,这类研究结果也很难具有改变现实的力量,只是就主观论主观,无法说明主观世界与客观世界的关联,研究结果难以与现实对接。这种对客观变量,包括行为变量的忽视,已经引起一些学者的警觉。Baumeister,Vohs和Funder(2007)从1966年、1976年、1986年、1996年以及2006年这五年的《人格与社会心理学杂志》中,每年大致选择2期,分析了实证研究报告中的共304项研究,统计这些研究是否包含实际行为变量(对行为的操纵、对行为的观测都可以算数),结果表明,在1976年,近80%的研究使用了行为变量,1986年后这个比例迅速下降,2006年已经低于20%。虽然心理学是研究心理和行为的科学,但我们今天已经没有耐心去现场观测和操纵真实的行为了,而是严重依赖被试在问卷和量表中的自陈报告,依赖在电脑上完成实验。由此,Baumeister等人用这样的文章题目表达了自己的忧虑――“心理学作为自陈报告和手指活动的科学”。
(4)样本选择
心理学研究样本的选择存在两个突出的问题。一是对大学生样本的过度依赖。二是对超大样本和单个被试的研究不足。为此,我们要充分重视样本性质(少用大学生被试)和规模(大样本、超大样本、单个案)的多样性。
对于心理学研究过度依赖大学生被试问题的诟病由来已久,但是现在不仅没有好转,而且问题似乎更严重了。大学生能否代表人类或某个总体,这可能要看问题的性质。例如,对于一些通则式规律(如格式塔学派发现的“完形”规律)的研究(辛自强, 2013),随便找个被试都可以证明规律的存在及其普适性,甚至无需从样本推论总体。但心理学研究更多探讨概率性题,需要从样本推论总体,显然在很多情况下,大学生不能代表全人类。我有一次参加博士论文答辩,该论的推理研究,每个子研究的被试都是一所国内著名大学的本科生和研究生,结果做的“很漂亮”,但总让人感觉这不是人类推理的一般状况。过于依赖同质样本,甚至根据某一标准选出一批“区组”被试,这有助于实验得到阳性结果,但却不利于结果的现实应用,因为现实中的人群更为复杂多样,个体间差异很大。因此,在论文评审和发表时,我们应该鼓励样本的多样性,鼓励选择合适的样本。必要时,可适当限制那些对大学生样本过度使用的论文(这大多是出于研究者找被试的方便或惰性),心理学不能都做成“大学生心理学”。我在和同事讨论专硕毕业论文的评审导向时,定了一条不成文的规则――学生必须到大学校园外边找被试。只是猫在象牙塔里做研究,难以体现应用导向。
心理学家习惯的样本量往往是几十到几百人的规模(即一般的大样本),也有些在上千人的规模,但很少涉及更大或超大的样本,也不太喜欢对单个被试或个案的研究。全世界范围内由社会科学家开展的大型调查项目有很多,最著名的如“世界价值观调查”,它最近一次的调查从超过50个国家和地区取样,样本量达到7、8万人。但心理学家很少主持这么大的调查项目,近年来兴起的大数据方法,激发了对一些超大型样本的研究。例如,彭凯平(2014)课题组基于大数据理念,通过搜索某年度新浪微博的所有数据来分析中国人幸福感的时空规律。心理学家应该更多关注那些大型调查数据以及官方统计数据的使用,关注大数据方法。除了大数据、超大样本,心理学还应重视“被试量为1”(即N=1)的研究,也就是单个案研究。它包括个案研究和单被试实验,前者大致是对个案的描述性、观察性研究,后者是对单个被试的实验研究。
稍微回顾一下历史,可能更有助于理解单个案研究的价值。在心理学的早期历史中,对单一被试或者少量被试的研究曾一度占据着核心的位置。不仅心理物理学研究使用少量被试,艾宾浩斯记忆研究的对象只是研究者本人,巴甫洛夫条件反射研究的被试是一条或几条狗,华生对情绪的研究也只是采用很少的被试(如小艾伯特),精神分析学派、格式塔学派也都依赖个案或少量被试。心理学家广泛使用实验设计、大样本和推论统计这些方法是很晚近的事情,这种转向要归功于英国统计学家费舍《实验设计》一书在1935年的出版。从20世纪30年代开始,心理学期刊虽然还发表一些单个案的研究,但是这类研究的数量迅速减少,它们转而发表更多的对大样本做统计分析的研究成果,有控制的群组设计逐渐成为主流范式,研究者依赖统计分析确定实验组与对照组的差异是否显著。这次转向后形成的方法学规范一直延续至今。然而,当我们将群组比较的结果推广到个体层面时未必妥当,因为行为作为一种现象发生在个体层面而非群组层面;心理学作为行为科学, 必须理解 “个体” 如何与环境互动(Barker, McCarthy, Jones, & Moran, 2011,p18)。因此,单个案研究的价值在今天需要被重新强调。
在很多情况下,单个案研究往往以更直观的方式启发研究者确立富有生态效度的研究结论。例如,一种临床干预方法若有效,它应该是在一个又一个个案身上“应验”过的,这种方法有效性的结论是在个案基础上概括出来的;然而,群组研究中,是以变量为中心在很多个案身上统计出的平均结果,这个结果未必适用于每个个案。因此,有学者认为,单被试实验更能证明某种“实践的有效性”(如咨询实践的疗效),而非刻意在实验室内考察“研究的有效性”(Yarnold, 1992, p179)。当然,单个案研究不仅是个样本量的问题,而有着与群组设计完全不同的推理逻辑,下文再论。
(5)实验的生态效度
虽然可能以偏盖全,但大多数人认可,心理学作为一门科学的诞生,是以实验室建立和实验法的运用为标志的。实验法通过操纵自变量、控制无关变量、观测因变量这样的逻辑,确保得出因果性结论。心理学实验往往是操纵客观变量,然后观测它对主观变量的影响,或者通过操纵客观变量间接操纵主观变量。“操纵”就代表着某种力量,心理学实验的结果可以启发人们如何在现实生活中操纵心理、改变现实。然而,每一项心理学实验的因果力(内部效度问题)和推广价值(外部效度问题)可能并不相同,这里重点讨论外部效度、特别是生态效度问题。因为心理学要具有改变现实的力量,必须确保实验结论能外推到现实生活中,这取决于至少如下两个因素。
一是实验处理效应的稳健程度。一项实验中设置的条件、处理、干预方法的效应有即时效应和延时(短期、长期)效应的区分。很多实验操纵有即时效应,但是否有延时效应呢?大多数研究者并未考虑,也未报告。如果一项研究能够不仅证明实验处理的即时效应,也能证明其延时效应,这就有助于实验结果的推广应用。早年间,可口可乐公司为了与百事可乐公司竞争,研究过配方改良问题。百事可乐更甜一点,可口可乐带点酸味。可口可乐公司做过实验,让消费者品尝各品牌的一小杯可乐,结果大多数人认为百事可乐更好喝。可口可乐公司根据所谓实验结果改良了配方,使之更像百事可乐,销售结果却惨遭失败。失败原因很多,其中之一是在实验室里喝一口,与拿回家去喝一瓶的感受是两码事。很多心理学实验发现了各种暂时的效应,但其推广价值存疑。有人开玩笑说,“目前大多数的心理学实验,是‘喝一口的心理学’,而不是‘喝一瓶的心理学’(万维钢, 2014, p246)。”实验处理效应不仅表现在持续性上,还表现在强度上。当采用特别敏感的观测指标时,或者使用特定的检测方法时,很多实验得到了阳性结果,但是这种实验处理的效应未必足够强劲和稳健,因而难以重复和推广。例如,近几十年,社会心理学领域有关启动效应的研究呈现井喷状态,但其结果的可重复性不断被质疑,原因之一就是这种启动效应往往很微弱(张h, 辛自强, 2016),其可被重复观察到的难度增大,更不用说在现实生活中推广应用了。
二是实验场所问题。实验可以在实验室里进行, 也可以在现场, 也就是一种心理和行为通常发生的真实场所中进行。实验室环境容易操控,但人为性很强,容易得出“伪结果”(人为,就是“伪”;辛自强, 2012, p122)。社会心理发生在社会生活中,教育心理发生在学校中,消费心理发生在商场中,到这些真实的场景中做现场实验有助于提高心理学研究的生态效度和应用价值。例如,我们一项关于信任的实验,是在北京到烟台的K285次列车卧铺车厢里完成的,以旅客为被试(辛自强, 辛素飞, 2014),火车是移动的优质实验室。更令人震撼的是下面这项研究。研究者在美国一家游乐园,以11万余名游客为被试,考察了他们是否愿意购买乘坐过山车时由实验员为其拍摄的照片作为纪念。自变量为定价方式(包括明码标价和自愿付钱)、捐赠与否(一半游客被告知照片销售收入的半数将捐赠给慈善机构)。结果表明,当游客能按照自己的意愿付钱时,同样的慈善因素让企业获益更多,因为游客通过自愿付钱表达了自己对企业社会责任的认可(Gneezy, Gneezy, Nelson, & Brown, 2010)。这种大规模的现场实验得出的结论显然比实验室实验更有说服力,更有生态效度,而且这项实验做下来还多赚了很多钱。
大家热议的心理学实验“可重复性危机”,究其原因是很多结果是在实验室里“做出来的”,而且所发现的实验处理效应很微弱,缺乏持续性,这种不稳健的效应自然难以重复,也难以发挥心理学改善现实的作用。因此,我们应该充分鼓励对实验延时效应的考察,鼓励现场实验(如教育实验、社会实验),鼓励长期干预研究。心理学不能过分追求实验室研究的“小巧”,而应该展示实验干预的强大力量,甚至直接开展社会改造实验。
(6)统计方法
这里要讨论的不是统计方法本身,而是统计实践问题。统计方法只是研究的工具,研究目的不同,对于统计方法的需求和应用实践就有所差异。我在统计方法的学习方面,只是一知半解的水平,这里仅“随意”罗列几个问题供大家讨论。
第一,描述统计的重要性。描述统计是推论统计的基础,没有描述统计结果,推论统计的结果是很难理解的,因此论文要充分报告描述统计结果。如果一项研究被纳入元分析研究,也通常要求提取其描述统计结果以便做元分析。从传播效果上看,描述统计也很重要。特别是对于政策制定者、实践者、一般公众来说,用平均数、百分数、简单的图表来描述的结果,可能比复杂的变量关系模式图、拟合指数之类结果,更容易被理解,也更有力量。
第二,“统计上显著”还不够。心理统计的核心逻辑是“零假设显著性检验”,即p值方法,根据p值大小决定是接受,还是拒绝零假设。如果统计得到的p值比临界值小,比如小于005,就在005的显著性水平上拒绝零假设,而接受备择假设。这时我们只能表述某种结果“在统计上显著”,如果显著,则意味着随机因素不能解释这个结果,而只好归结为某种“必然性”(仍是统计上的必然性)。然而,p值的大小,并不能说明研究结果的重要性或变量关系的强度。它只表示p值越小,拒绝零假设时可能犯错误的机会或概率越小。效果量(effect size)则表明了我们专业上所关心的效果和效应的大小,比如实处理效果如何,变量关系强度如何,这是p值所不能传递的信息(辛自强, 2010)。因此,现在学术期刊都要求既报告统计检验结果是否显著,又报告效果量指标,如d、η2(Eta平方)、r2(决定系数)等。而且,我们应该更重视效果量指标,因为对于很多实验,特别是干预实验,实验组与对照组之间只是差异显著还是不够的,而且差异程度要足够大。否则,这种干预方法的现实应用价值,特别是经济价值不足。假如我们在每位老人身上投入了1千元,用于实施某种干预课程提高其幸福感,虽然最后实验组老人幸福感与对照组统计上有显著差异,但如果高出的程度,还不如直接发放给每位老人1千元的作用,那干预项目就没有真正的价值了。对于效果量如何算“大”,虽然有些建议性的解释“标准”(Kotrlik, Williams, & Jabor, 2011),但并没有什么严格的临界值,这要根据以往类似干预研究的效果量大小、政策需求、项目要求等来解释。顺便说一句,同样是效果量指标d,在单被试实验中要求的效果量通常比群组设计中大得多。例如,在群组设计中d值为08已经算是 “较大的” 效果量了,而在单被试实验中,这只能算“较小的”,d值在2、3以上也是常有的(Barker,
McCarthy, Jones, & Moran, 2011, p161)。
第三,兼顾变量指向的统计方法与个体指向的统计方法。当前心理学普遍使用的是变量指向的统计方法,如相关分析、方差分析、回归分析等,这些方法侧重描述变量关系,没有将个体看作整体,而是假设个体是可互换的单元,除了随机误差之外,他们在行为发展上不存在质或量的差异,即总体具有同质性。而事实上,在心理学中,总体中的个体常常是异质的,因此应该重视以个体为中心的完整分析(辛自强, 2013)。个体指向的统计方法是一种以个体为中心的分析方法,它的任务是确定心理和行为发展的个体差异或异质性。它假定就变量如何相互关联而言,总体是异质的,样本中可能存在异质性的个体亚组。通过个体指向的统计方法,如聚类分析、配置频次分析、模式发展的探索式分析、基于模型的聚类分析等,可以识别被变量的关联模式描述的个体亚组,识别基于纵向轨迹模式的个体亚组,识别在不同时间点上的个体亚组,以考察模式结构的稳定性和个体的稳定性(详见杨之旭, 辛自强, 2016)。以干预项目为例,可以用变量指向的统计方法揭示干预效果的一般趋势,而个体指向的统计方法可以识别出符合与不符合一般趋势的亚组并分析其原因,兼用两种方法将有助于全面评估干预项目的效果。
第四,“中介”和“调节”的是与非。在大陆心理学专业期刊里检索可见,2000年前后的时候,对研究结果做中介和调节模型分析的文献寥寥无几;2016年仅文章标题提到“中介”模型的文章就超过200篇,提到“调节”模型的超过100篇。现在打开任何一本心理学专业期刊,目录上到处都是“中介分析”“调节作用”之类的字样。中介模型和调节模型让我们严肃地讨论三变量关系问题,无疑有助于科学认识的深化,很多研究者确实在这些方面做出了重要发现和贡献。但是,也有更多文章是经不起推敲的,只是做了点这方面的统计而已,离得出可靠的理论模型还差很远。尤其是中介模型,它意味着三变量形成一条“因果链”,而因果关系的确立有着严格的标准,如时间顺序、操控逻辑,通过问卷、量表测出的一堆主观变量之间何来顺序和操控逻辑呢,因此也很难确定中介关系。无论是中介还是调节模型以及其他模型,其建立都不是简单的统计问题,必须有理论和逻辑的考量(辛自强, 2012, p279)。目前这类套路化、仪式化的统计分析方式,已经在限制我们的思考,限制我们发现知识的能力。如果不能通过研究达成确实的认识,建立有效的模型,就谈不上应用的问题。
(7)推理逻辑
当前的心理学研究过度依赖“假设-演绎”的方法,而对于如何观察现象,从经验资料中归纳假设(假说),形成理论认识这一归纳过程重视不够。这种推理逻辑使用上的偏畸,不利于培养研究者对现实的敏感性和想象力。
心理学研究通常使用的是“假设-演绎”的逻辑。其思路是基于假设演绎出对经验事实的预测,然后考察实际观察到的经验事实是否符合预测,若符合,则确证了假设的合理性。因为,很多事实单纯凭猜测,能预测到的机会是很少的,然而,我们居然根据一个理论假说准确预测到了,这足以确证理论假说的合理性,甚至真理性。这种演绎过程的逻辑较为完备,可以验证已有假设,但不利于发现新知识(新假设),因为假设-演绎的结果是事先就料定的了:如果假设验证了,就确认了这个知识;否则,我们只知道这个假设不对,但并不知道正确的是什么。
科学研究的关键是发现并提出假设,这就要求我们对现象有敏感性,善于根据零碎的线索做出归纳、猜想,从而形成理论假说。“虽然归纳本身常常难以保证逻辑上的完备性,然而,它对于科学发现的重要性并不亚于演绎,甚至更重要。因为对少量事实的归纳,是我们发现规律性,提出科学假说的基础。很多新思想的出现,往往是受到了某个事实的启发,受到了某个类比的启迪,受到了某个隐喻的暗示(辛自强, 2012, p297)。”
心理学研究对统计方法的过度依赖和套路化使用,强化了其背后的“假设-演绎”逻辑在学科中的地位,而无意中抑制了归纳逻辑的使用,不利于科学猜想和科学发现。实际上,其他一些方法更好地体现了科学发现的逻辑,心理学应该予以重视。例如,扎根理论研究方法的创立,就是对常规研究方法的反叛,即反对通常使用的“假设-演绎”逻辑――基于理论形成假设,然后用新资料来检验。扎根理论研究中,要尽量避免将研究者已有的理论范畴强加于资料之上,而是通过对资料的灵活归纳,从资料中生成理论,这一研究过程是自下而上的归纳过程(Glaser & Strauss, 1967)。运用扎根理论研究方法建构出的概念及它们之间的联系,不但是由资料中萌生出来,而且也被资料暂时性地验证过了。是故该方法建立的理论,可曰“扎根的理论,或者植根于经验资料的理论”,这样建立的理论是一种情境化理论,更具有生命力和现实解释力。
又如个案研究,也有助于形成假说和理论。如果单从统计推论的角度看,基于少量的个案获得的研究结果,无法摆脱个体差异的影响,难以推广到更大的总体上。不过,统计推论并不是获得一般性认识或规律性认识的唯一途径。如果在一个案例基础上推断出的一般性认识(如模式、法则),可以在其他案例身上得到验证或重现,就可以增强我们对理论的信心。或者反过来说,如果在个案基础上形成的理论假说,尚没有被任何一个已知反例挑战或驳倒,那么它就是一个可以接受的理论。若一项个案研究为理论假说的建立、反驳与修正提供了良好的机会,当然有重要价值。
综上,心理学研究不仅要重视统计方法及其背后的“假设-演绎”逻辑的使用,也要重视基于个案归纳理论假说,扎根于经验资料建构情境化的理论。也就是说,我们既要重视假说的验证,又要重视新假说的归纳和新理论的建构,惟有如此,才能增强我国心理学研究的原创性,使研究成果更贴合实际(包括我国实际),提升其现实解释力。
(8)理论建设
科学研究并非只是为了积累事实,而且要建构理论。一部心理学的历史,除了经典的实验,就是观点各异的理论。要想在心理学历史上留下点什么,要么开展一项堪称经典的实验,要么创立一个伟大的理论。我国心理学要增加国际影响力,增强现实解释力,就必须重视原创理论的建设,而非停留在验证国外理论或现有理论的境地。建设理论并没有想象的那么困难,并非只有心理学的“大家”或大师才可以建立理论。我们大家(每个人)都可以在自己的研究中建立理论。了解了心理学理论的类型或形态,就会知道自己应该建立哪种理论以及如何去做(对这块内容的详细论述,见辛自强, 2012, pp326-345)。
第一,描述事象的理论。描述事实和现象是科学研究的基本功能之一,这种描述就可以构成一种简单的理论。关于事实的理论可以描述一个事物的属性,也可以描述变量的关系。例如,米勒描述了短时记忆的容量,就是在描述一个事物的属性;艾宾浩斯遗忘曲线描述了记忆保存量和时间的函数关系,这是关于变量关系的理论。除了描述事实之外,还可以对所研究的现象进行简单概括,从而形成一种理论观点,如问题解决的“试误说”“顿悟说”等。能用一个术语或理论描述一种前人未曾发现或者未曾言明的现象,这是巨大的理贡献。
第二,类型学理论。它用于区分并描述事物的不同类型。建立类型学理论首先要确定分类的维度,在此基础上划分并定义类型,然后描述该类事物的特征,并将这种类型划分用于实际观察,或者用实际观察结果检验这种类型划分。分类的标准或维度可以是单一的,也可以是双重维度或多种标准。例如,场独立与场依存、A型与B型人格都是单维上的类型划分;荣格对性格类型的划分,则采用内-外倾向和四种心理功能(感觉、思维、情感和直觉)两个维度结合划分出了8种性格类型。艾森克从外倾-内倾、神经质、精神质三个维度确定人格类型。类型学的研究,实际上是人类分析思维的表现。初步的认识是对事物的直觉把握,很少清晰分出维度。而分析出维度和类型使得我们可以深入认识每一类事物的具体特征。这种类型的划分可以通过思辨完成,也可以借助统计学的方式进行分类或类型的验证,如因素分析、聚类分析都有这种功能。
第三,过程理论。类型学理论侧重在空间上将事物划分为不同类型,以分析不同类型的特点。而过程理论主要与时间维度有关。这种过程,在心理学中主要体现为认知过程或信息加工过程、学习过程等。过程理论在时间维度上刻画事物变化的流程、经历的不同状态等。例如,早期行为主义者提出的刺激-反应(S-R)公式反映了一种最简单的“过程”;新行为主义者在刺激和反应之间加入了有机体变量(O),提出了S-O-R的公式,这时过程的味道有所增加;后来,信息加工理论又将O分解成更多的环节,这样认知过程的意思就很明显了。由于每次认知活动都耗费一定时间,所以这个过程必然是时间过程。无论是认知还是学习,都是主体应对外部客观世界的过程,对外部刺激的处理需要耗费一定的时间。这里的时间,大多是小尺度上的时间,多要以毫秒、秒、小时、天等来计量,而且只衡量时间的长度,一般不关注时间的方向。
第四,发展理论。过程理论通常只关注时间的长度本质,而发展理论往往在更大的时间尺度上(如月、年)探讨事物在时间维度上的展开过程、演化过程,这里的时间是有方向的,不可逆转的。例如,对于发展心理学家、进化心理学家来讲,真正要解决的问题是心理如何随时间而发生和变化。发展理论通常有两种方法描述发展:关于发展的极性变量与里程碑顺序。“仅仅从低水平到高水平的数量方面的差异变量可以称之为极性变量(polar variable), 而那些性质上不同的转折点可以称之为里程碑顺序(milestone sequences)。极性变量与里程碑顺序之间的差异是连续和非连续变量之间差异的扩展和发挥(卢文格, 1998, p52)。”通常,从极性变量的层面认识事物,是更直接、更直觉的把握方式;而看到并解释清楚里程碑式的间断性发展或直接说出阶段的本质差异,则是更深入,也更困难的一步。例如认知发展研究,测量学派的通常做法是设计若干题目考察某个年龄儿童的通过率,会做的题目越多说明能力越高。在这个意义上,能力是可以累积的,因为研究者并不区分做对这道题和那道题有什么能力上的本质差异,做对每道题都得到同样的单位分数。而皮亚杰看到了这种分数差异背后的结构问题,认为那些在某个任务上表现良好与不好的孩子在认知结构上有根本的不同,由此,他提出了认知发展的结构观,对发展做了里程碑式的、阶段的描述。
第五,结构理论。“阶段”通常被泛泛地用作“发展水平”的同义语,然而,在最严格的意义上,阶段指代由特定的结构决定的发展水平质的差异。结构是由要素之间的一系列联系或关系组成的,这种联系提供了一个整体,并赋予要素以意义,使要素成为整体中有意义的部分。要素之间的关系变化了,结构也就变化了;但是要素本身变化,结构不一定变化。结构是组织的形式而非内容。这么看来,“发展是由决定要素之间联系的基本规则的获得或变化组成的(卢文格, 1998, p32)。”在心理学中,皮亚杰是结构主义的代表人物,他用逻辑数学结构成功刻画了儿童的认知发展阶段,这种做法后来被科尔伯格、塞尔曼等人推广到道德推理、观点采择研究中。然而,并不是每个心理学家,都像皮亚杰那样理解结构,结构也并非只用于刻画发展阶段,即不只是“发生的”结构。心理学中的“结构”还有很多其他形式,像机械的结构(如弗洛伊德的人格“三我”理论)、统计学层面的结构(如人格与能力的因素结构)。
第六,功能理论。“结构”和“功能”往往是一个事物或系统的两个方面,它有结构,也必然有功能。正所谓结构是系统内部要素的关系,功能是系统与其之外的系统之间的关系。这两个定义只是在最抽象的意义上界定了“结构”和“功能”的内涵。就像“结构”一词具有多种含义那样,心理学家所说的“功能”的含义也至少有两类。一方面,指心理功能。这里的“功能”有时被称作“机能”,有机体有各种心理方面的机能,或者心理功能。例如,在认知心理学中,智能就被定义为一系列的功能,包括符号或信息的输入、输出、存储、复制等。另一方面,指心理的功用。心理的功用体现在三个方面:心理这个系统对其外的环境系统所发挥的作用;某种心理机能对其他心理机能或系统所起的作用;某种心理机能对现实生活的作用或应用价值。简单说,心理的功用, 就是心理功能的功能。 例如, 美国的那些机能主义者(如詹姆斯、杜威、安吉尔等)认为,心理或意识的主要机能是选瘢最终是为了适应环境以求生存。
此外,心理学中的很多理论都属于“影响因素”理论,用于描述或解释事物发生的内部原因与外部条件。有的理论属于“层级”理论,如马斯洛的需要层次理论,将事物划分为不同层次或等级,并阐明每个层级的特点以及层级之间的关系。
综上所述,心理学研究和理论总是涉及世界的两个维度:时间(发展与过程)与空间(类型、层次、结构、功能、关系)。从时间方面来说,关于短时间尺度的是认知与学习过程理论,关于中等时间尺度的是毕生发展理论,关于宏观时间尺度的是心理进化理论与心理变迁理论。从空间方面来说,要么是关于元素的理论(描述事象的理论、类型学理论),要么是关于一个系统内部要素关系的理论(结构理论),要么是关于系统之间关系的理论(功能理论、影响因素理论、层级理论)。理论建构总是与时间或空间有关:以之为对象,在不同层次和侧面上进行理论建设。心理学研究要强化现实性与应用导向,就必须重视理论建设。我们要记住勒温的名言――“没有什么比一个好理论更实用了。”
3小结:必要的方法论变革
为回应国家和社会发展对心理学的巨大需求,心理学研究者需要深入反思所奉行的方法论,以及所遵从的研究模式,做出必要的理念与方法调整。本文罗列的上述八个方面的方法论问题,可以归纳为三个层面。
首先是研究理念的变革。我们要推动基础研究和应用研究均衡发展,兼顾旨在理解的学术成果和旨在改变的学术成果,尤其要重视后者;提出问题时,不仅要根据文献选定尚无人研究过的问题,更要从现实出发,研究尚没有解决的实际问题。
其次是实证研究方法的变革。在变量选择方面,一项心理学研究既要有主观变量,也要有客观变量,以探讨两方面关系为己任;在被试选择方面,减少大学生样本的使用,增加样本的多样性,而且,除一般的大样本外,还要加强超大样本和单被试的研究;在研究生态效度的提升方面,需要增强实验处理效应的稳健性,重视现场实验;在数据统计层面,重视描述统计和效果量指标,兼顾变量指向的统计方法与个体指向的统计方法,注意中介和调节模型的理论分析。
最后是理论思维的变革。 在推理逻辑方面, 不仅要重视统计方法及其背后的“假设-演绎”逻辑的使用,更要重视归纳逻辑的使用,如基于个案归纳理论假说,扎根于经验资料建构情境化的理论,增加研究者的现实敏感性与想象力;在理论建设方面,掌握各种形态理论的建构方法,敢于并善于提出原创性理论。
总之,我们要在方法论的上述三个层面上,变革心理学学术研究共同体遵奉的一些不当规范和实践模式,通过改变“现实的心理学”,建设旨在“改变现实”的心理学学科,增强研究成果的现实解释力和应用价值。
⒖嘉南
林崇德, 辛自强 (2010). 发展心理学的现实转向. 心理发展与教育, 26(1), 1-8.
卢文格 (1998). 自我的发展. 韦子木译. 杭州: 浙江教育出版社.
彭凯平 (2014). “幸福中国”大数据研究. 心理技术与应用, 8, 3-4.
万维钢 (2014). 万万没想到: 用理工科思维理解世界. 北京: 电子工业出版社.
辛自强 (2010). 有关心理统计的三个疑问. 华南师范大学学报 (社会科学版), 1, 39-46.
辛自强 (2012). 心理学研究方法. 北京: 北京师范大学出版社.
辛自强 (2013). 实证社会科学中的因果关系与理论解释: 我们需要理解的十对概念. 清华大学教育研究, 3, 7-15.
辛自强 (2015). 理解并改变: 师生共进的治学之道. 中央财经大学校报, 11月23日第3版.
辛自强 (2016). 同心协力谱写杂志发展新篇章. 心理技术与应用, 4(4), 193-194.
辛自强, 辛素飞 (2014). 被信任者社会身份复杂性对其可信性的影响. 心理学报, 46(3), 415-426.
杨之旭, 辛自强 (2016). 应用心理学中的个体指向方法: 理论、技术与挑战. 心理技术与应用, 4(12), 744-762.
张h, 辛自强 (2016). 社会心理学中的启动研究: 范式与挑战. 心理科学进展, 24(5), 844-854.
Barker, J., McCarthy, P., Jones, M., & Moran, A. (2011). Singlecase research methods in sport and exercise psychology. London: Routledge.
Baumeister, R. F., Vohs, K. D., & Funder, D. C. (2007). Psychology as the science of selfreports and finger Movements: Whatever happened to actual behavior? Perspectives on Psychological Science, 2(4),396-403.
Glaser, B. G., & Strauss, A. L. (1967). The discovery of grounded theory: Strategies for qualitative research. New York: Aldine.
Gneezy, A., Gneezy, U., Nelson, L. D., & Brown, A. (2010). Shared social responsibility: A field experiment in paywhatyouwant pricing and charitable giving. Science, 329(5989), 325-327.
Kotrlik, J. W., Williams, H. A., & Jabor, M. K. (2011). Reporting and interpreting effect size in quantitative agricultural education research. Journal of Agricultural Education, 52(1), 132-142.
Yarnold P. R. (1992). Statistical analysis for singlecase designs. In F. B. Bryant, J. Edwards, R. S. Tindale, E. J. Posavac, L. Heath, E. Henderson, et al. (Eds.), Methodological issues in applied social psychology (pp. 177-196). New York: Plenum Press.
Abstract