前言:寻找写作灵感?中文期刊网用心挑选的心理测量学在信用风险评估中的应用,希望能为您的阅读和创作带来灵感,欢迎大家阅读并分享。
摘要:为了帮助薄信用的客户获得贷款以改善他们的生活,鉴于心理测量学能够有效地对个体差异进行测量并对行为决策进行预测,很多征信机构或者信用评分公司采用心理测量学方法对借款人进行信用评分。总结信贷市场上基于心理测量学的信用评分实践,发现该方法尽管可以很好地降低违约率,但在数据收集、数据分析及普适性方面仍存在一些不足,有待进一步改进。
关键词:心理测量学;信用风险管理;信用评分;普惠金融
一、研究背景
据统计,全球有将近50%的成年人因缺少可以进行信用评估的数据被排除在信贷系统之外。为了帮助更多的个人和小微企业获得贷款,扩大贷款的客户群,促进普惠金融发展,很多征信机构或信用评分公司开始探索基于替代性数据对客户进行信用风险评估。目前看来,使用的替代性数据包括公用事业支付记录、电子商务交易信息和付款信息、心理测试数据以及少量社交媒体数据等。这其中,基于心理测量方法的信用评估受到推崇。心理测量是用来衡量个人态度、行为或在某种情况下认知能力的标准评估方法,通过分析心理测试数据可以预测还款意愿,并能生成帮助放贷机构评估借款申请人信用风险的信用评分。行为金融研究表明,个体差异解释了消费者偏离经济最优决策的原因[1],也就是说,一个人的个性与债务积累、消费支出模式以及规划和预算行为有关。比如,尽职尽责的人往往不会花钱购买超出他们负担的物品,一旦发生了购买行为,就会努力履行他们的责任,而缺乏自律和粗心预算则是个人债务积累的主要原因,因此,在使用信贷之前用理性决策方法评估购买的人随后不太可能陷入财务困境。在此基础上,Bernerth等人分析了心理测量结果和信用评分之间的关系,研究发现责任心和信用评分成正相关关系,而宜人性和信用评分成负相关关系[2]。换句话说,越有责任心的人信用评分越高,而宜人性越高的人可能会因为性格中的信任、顺从和宽容等特质,容易为他人牺牲个人资源而做出无法实现的承诺,因而信用评分越低。目前,部分征信机构或信用评分公司基于心理测量学进行信用评分并将其进行了实际应用,其应用效果如何、存在哪些不足,都关系着信贷机构以及借款方的切身利益,是双方关心的热点问题。因此,本文将通过分析征信机构和信用评分公司将心理测量学应用于信用评分的研究和实践结果,总结当前基于心理测量学的信用评分市场的现状与不足。
二、心理测量学与信用评分
(一)心理测量学的概念和历史演变
心理测量学是一门有关心理评估的科学,通常被视为心理学的一个分支,但其影响远不止于此[3]。人们在很多时候都需要经历评估,比如在学校学习期间接受测试以衡量学生的表现;在学校学习结束时接受测试以获得学历证书;当需要通过信贷购买或申请抵押贷款时,必须填写以相同方式评分的表格。评估形式有很多种,包括面试、考试、实践等。但是,尽管应用和表现形式多种多样,但所有评估都有一套共同的基本特征,即它们应该是可靠的、有效的、标准化的、没有偏见的。评估方法有好有坏,而心理测量学可以最大限度地提高评估质量。心理学领域的其他方面都没有对个人日常生活产生这样的影响。心理测量学的历史可以追溯到很久以前。达尔文的表弟弗朗西斯•高尔顿爵士(SirFrancisGalton)对人类智力的演变特别感兴趣,他在1869年出版了《遗传天才:对其规律及结果的探究》一书。该书研究了人们拥有的不同特征,以及这些特征如何使一部分人比其他人更优秀。这些差异正是科学心理学研究的重要领域。心理测量学的早期理论和应用工作主要是为了测量智力。高尔顿在研究中设计并包含了心理测验。美国科学家詹姆斯•麦基恩•卡特尔(JamesMckeenCattell)扩展了高尔顿的研究,并于1887年建立了世界上第一个心理测量实验室。他们开发的观察和分析技术是心理测量学的基础[4]。心理测量学的另一个主要焦点是人格测试,目前已有一系列理论方法来概念化和衡量人格。一些为人熟知的工具包括明尼苏达多相人格量表、五因子模型(或“五大人格理论模型”)、个性与偏好量表,以及迈尔斯-布里格斯类型指标等工具。这些测量工具在不同人群和许多语言版本中经过几十年的不断测试与发展,结果表明其测试是有效的、可靠的。
(二)引入心理测量学的信用评分
信用评分是基于借款人(个人或者企业)的信用信息,通过一些统计分析方法,预测借款人未来的违约概率,通常用一个数字来表示个人或者企业的信用高低。信用评分被应用于多种领域,比如放贷机构使用信用评分来决定是否提供贷款以及收取多高的利率;医疗服务提供者使用信用评分来确定患者是否会获得免费或折扣护理;保险公司使用信用评分来决定是否承保汽车和房主的保险;雇主在背景调查中使用信用评分来进行招聘决策。信用评分也被用来帮助投资者判断其在资产支持证券中的风险敞口,或者将医疗保健行业的应收账款分配给收款机构。在所有这些应用中,高信用得分的客户会带来更高的收益,而低信用得分的客户则与较高的成本相关联[5]。
1.基于传统数据的信用评分
根据用于信用评分的信息,可以分为三类信用评分[6]。第一类是申请评分,用于评估和决定新申请人的信用,该评分主要基于客户在申请信贷时提供的信息(例如社会人口统计数据、可支配收入、担保人、贷款金额等)。第二类是行为评分,用于根据现有客户的信用和当前账户的行为(例如余额、支付历史、存款、信用卡的使用情况等)对现有客户进行分类。第三类是根据企业的财务信息对公司及其所有人进行信用评分。信用评分模型可以分为两大类:判别分析方法和机器学习方法[6]。判别分析是开发信用评分系统的第一种方法。在零售银行业务中,主要集中在消费贷款和商业贷款这两类贷款的授信方面。比如在金融领域使用最多的逻辑回归方法和线性规划方法。另一类是机器学习方法,比如支持向量机、神经网络、遗传算法[7],这些方法均应用于信用评分模型的开发。
2.基于心理测量学的信用评分
为了解决薄信用客户很少或者没有机会获得信贷的问题[6],并且鉴于通过消费者心理可以预测消费者行为并在众多领域得到验证(比如资金管理[8]、购买行为等),心理测量学方法被引入信用评分领域。Perry(佩里)使用调查数据来检验人格对信用评分的影响,并且还发现与教育、收入和年龄增长相关的得分较高,但与健康状况不佳、失业和收入较低相关的得分较低[9]。该研究还描述了一项针对受访者的测验,该测验显示出信用评分越高,受访者的金融知识越丰富、对生活的控制感越强。Arráiz(阿拉伊兹)等人研究了由EntrepreneurialFinanceLab(创业金融实验室,简称EFL)设计的用于信用评分的心理测量学测试,研究发现心理测试有助于没有信贷记录的企业家获得信贷[10]。
三、基于心理测量学的信用评分实践分析
基于以上研究成果,EFL(创业金融实验室)、VisualDNA(视觉基因)、Compuscan(莱索托康普斯坎)和Coremetrix(库尔测量)等征信机构或信用评分公司,与放贷机构合作,通过采用调查问卷的方式获得客户的心理测试数据,在分析这些数据的基础上,对客户的个人信用风险进行了评估,取得了良好的效果。
(一)EFL
EFL由Klinger(克林格)博士和DJDiDonna(丹尼斯•迪东纳)于2010年创立,是最早采用心理测量信用评分的信用评分公司,截至目前已有十几年的历史。该公司认为每个人都拥有自己的人格特质,而这些特征可以帮助他们了解客户的风险画像,进行信用风险评估。EFL基于25个以上的人格特质识别出可能会偿还借款的客户,这些人格特质包括控制点、流体智力、冲动、自信、延迟享乐、责任心等。其中,控制点是指个体认识到的控制其行为结果的因素;流体智力是一种以生理为基础的认知能力,如知觉、记忆、运算速度、推理能力等;延迟享乐是指延后得到某物的时间,从而得到更大的利益。EFL发现冲动型客户和其他客户相比拥有更高的违约率,拥有高贴现率的客户比拥有低贴现率的客户的风险性更高,等等。EFL评分的实践结果表明,在肯尼亚,心理评分最低的25%客户的违约率是心理评分最高的25%客户的7倍。此外,基于EFL评分,EFL的合作伙伴可以在不提高违约率的情况下增加15%~35%的投资组合[12],在不减少业务量的情况下违约率减少了16%~72%[13]。
(二)VisualDNA
VisualDNA成立于2006年,是一家消费者洞察和分析公司,该公司将大数据技术和心理测量学相结合,基于传统的五大人格理论模型(即开放性、责任心、外倾性、宜人性和情绪稳定性五个维度),同伦敦大学学院、剑桥大学和哥伦比亚大学的学者对五大人格理论模型赋予了新的解释,建立了自己的模型。在他们建立的模型中,开放性是指具有想象、审美、情感丰富、求异、创造、智能等特质[14]。开放性低的人不喜欢冒险,更倾向于主流和经过考验的事物,思考方式比较实际和直接,思想比较保守;而开放性高的人则相反,喜欢冒险,愿意尝试新鲜或者与众不同的事物,信仰自由。责任心显示胜任、公正、条理、尽职、成就、自律、谨慎、克制等特点。责任心低的人拥有无忧无虑、随和的生活态度,他们花在做决定上的时间较少,选择比较大胆,这意味着他们更加自信,对于现状比较满意;责任心高的人则具有强烈的责任感,做事情深思熟虑、有条理,尽管为人相对谨慎,但同样雄心勃勃。外倾性表现出热情、社交、果断、活跃、冒险、乐观等特质。外倾性低的人在社交场合比较矜持,为人较为冷静和严肃;外倾性高的人善于交际、更合群,天生精力充沛,与外倾性低的人相比,更加自信和快乐。宜人性具有信任、利他、直率、依从、谦虚、移情等特质。宜人性低的人通常出于自身利益行事,不太可能为了迁就他人而在行为上做出让步,对他人漠不关心,天生多疑;而宜人性高的人是利他主义者,有同情心,真诚,信任他人。情绪稳定性是指保持情绪稳定的能力,具有平衡焦虑、敌对、压抑、自我意识、冲动、脆弱等情绪的特质。情绪不稳定的人易感到焦虑和不安,能够敏锐地感受到他人的情绪,尤其是负面情绪,顺从但不武断,常沉思和自我反省;而情绪稳定的人,自信,有韧性,善于抵御外部负面事件,能够控制自己的负面情绪,即使是在社交场合,也会感到平静和自在。VisualDNA使用该模型设计了基于图像的调查问卷,从收集到的数据中对客户的偿还意愿进行了有效预测,在俄罗斯、土耳其、墨西哥、马来西亚、波兰和南非的众多零售银行的信用卡和个人贷款业务中,在同等业务量的情况下违约率减少了23%,并使得50%以上薄信用客户获得贷款[15]。
(三)Compuscan和Coremetrix
2016年,作为非洲最大的独立的征信机构之一的Compuscan公布了同Coremetrix的战略合作。Compuscan成立于1994年,致力于在整个信用生命周期内提供全面的信用报告和风险管理解决方案。Coremetrix则成立于2012年,通过结合数据科学家、心理学家、工程师的方法,构建并开发了富有洞察力的个性测验,在金融服务领域创建新数据,并在消费者个性和信用意图之间建立了联系。该战略合作的目的是使用心理测验来补充传统评分技术的不足,以评估被视为边际风险的消费者,使Compuscan的客户能够评估具有有限信用信息的申请人,从而扩大其客户群。Compuscan和Coremetrix通过基于图像的问卷获得申请人的信息,从五大人格理论模型以及动机、行为倾向性等维度刻画消费者心理,了解消费者信誉度产生的原因,其测试结果以风险评分体现,其中基于图像设计调查问卷的优点在于可以触发消费者的本能和情绪反应,进而获得更准确的数据。在此基础上,结合已有数据或者只依据心理测量数据,Compuscan和Coremetrix为信贷提供商、金融服务提供商、保险公司和风险管理者提供薄信用客户的个人信贷指数和相关的金融产品适用性指数。该测试通常会在标准风险评估完成后进行,消费者可以选择是否愿意进行心理测试。该测试可以为消费者在基于传统评分方法被拒绝信贷的情况下,赢得基于心理测量分数进行第二次评估贷款申请的机会。2017年,Compuscan和Coremetrix将该心理测量模型应用于印度10000名高风险信用客户,时间为3个月,他们发现心理评分越高不良率越低[16]。在此基础上,Compuscan和Coremetrix在对10000名南非消费者进行信用评估时,只基于征信机构数据进行风险评估的模型的Gini系数(衡量记分卡区分好客户和坏客户的能力)为0.25,加入心理测量数据后,信用评分模型的Gini系数达到0.3,评分效果提高了20%。与此同时,他们在传统的记分卡方法上进行了改进,通过使用机器学习技术(比如神经网络、聚类、随机森林等)构建模型中包含的特征,得到评分效果更好的信用风险模型[17]。在实际推广应用中也证明,Compuscan和Coremetrix采用的方法可以提高信贷产品的接受率,同时也降低了违约率,而且可以增加可持续贷款,降低拖欠率,使消费者获得更公平的审贷结果,促进经济发展[18]。
四、分析与启示
从几家机构应用心理测量学开发信用评分的实践来看,有如下特点:在数据收集方面,在线调查问卷是心理数据获取的主要方式,问题的提问方式主要包括文字形式和图像形式两种。文字形式的问题,清晰、易懂,但是需要仔细阅读;而图像形式的问题,简洁、直观、有吸引力,但是需要用户去理解图像所表达的含义。在心理测量学变量方面,五大人格理论模型是主要的心理测量模型,主要进行人格评估,相比于VisualDNA、EFL等公司增加了其他维度的心理测量要素。在信用评分模型方面,传统的评分方法被广泛采用,而机器学习方法采用的相对较少。尽管目前基于心理测量学进行信用评分已取得了一定的研究成果,但仍存在着如下不足。第一,收集的数据真实性难以保障。心理测量数据常常通过问卷形式获得,这就存在借款申请人因了解问卷填写目的故意隐藏真实想法、填写虚假信息进而获得贷款的可能。同时,由于问卷的填写是基于互联网,不需当面填写,往往会存在申请人在专业人士的指导下填写问卷的可能。这就需要征信机构或信用评分公司建立问卷填写真实性的识别方法,而且,因为这是申请人和信用评分公司不断博弈的过程,需要征信机构或信用评分公司定期更新识别方法,完善心理测量学信息收集过程。第二,心理测量维度和模型的丰富度有待提高。是否心理测量的纬度越多,信用评分越有效,还有待于进一步探索研究,因为维度越多,变量间产生共线性的可能性就越大,用户需要回答的问卷问题就会越多,会让用户产生厌烦心理,进而消极回答问题,因此,如何建立有效的心理测量模型还需要对比研究。此外,在信用评分模型方面,机器学习方法的应用仍在探索中,还需要深入研究。第三,还款能力未能考虑在评分模型中。由于心理测量方法只是从心理的角度衡量客户的信用风险,而另一方面,还贷能力也是影响信用风险的重要因素,它会直接影响还贷行为发生的可能性。因此,只基于心理测量学进行信用评分是不全面的,应将其与存款信息、工作情况等能表示还款能力的指标相结合,从心理层面和实际经济能力两个方面共同对信用风险进行更全面的评估。第四,基于心理测量学的信用评分方法的普适性需进一步验证。考虑到不同国家、不同地区文化差异对人们心理形成的影响,以及政治和法律环境对金融决策的影响,同一分析模型对于不同地区消费者评估的准确性需要进一步探索。当环境发生改变时,以往的研究结果可能也会发生改变,不能以其作为制定决策的依据,因此,需要根据不同国家、不同地区人们的心理特点,适时调整模型,使信用风险评估模型达到良好的预测效果。
作者:王静 杨渊 赵以邗 单位:中国人民银行征信中心 中国人民银行金融研究所