当前机器学惯用于保险业和信誉评分的能够性分析
作者头像
  • 阙婷
  • 2019-12-20 16:48:35 7

机器学习在信用评估中的应用:现状与前景

机器学习在金融领域的应用激发了人们对于利用人工智能自动执行从欺诈检测到客户服务流程的兴趣。尽管某些应用场景的确定性不及其他场景,但我们的研究显示,未来五年内,银行将继续投资于机器学习,特别是用于处理与风险相关的流程,包括保险业。

在一次关于行业AI的访谈中,我们与ZestFinance的首席技术官Jay Budzik进行了交流,探讨了承销商如何利用基于机器学习的信用模型来赢得更多业务,并通过采用新的数据源来降低风险。这些数据源如今可以通过数字化手段获取,并且已经成熟,可以应用于机器学习模型。

这些模型正在挑战传统的信用评分技术,比如FICO评分和简单的评分卡。本文将讨论机器学习如何扩大贷款机构的客户群体,包括那些传统信用评分难以覆盖的人群,以及那些信用评分无法准确反映其风险的人。

传统信用评分变量与新数据源

在过去三十年中,FICO评分和类似的信用评分成为信用建模的标准。FICO允许银行、信用卡公司和其他贷款机构客观地评估借款人的信用情况。评分基于五个因素,每个因素由多个不同权重的变量组成,每个变量占总FICO得分的百分比:

  1. 信用历史(35%):信用报告上的不良记录和良好记录。这些记录主要包括逾期付款、破产、丧失抵押品赎回权等。
  2. 信用利用率(30%):FICO得分取决于借款人在特定账单周期内使用了多少信用额度,以及拥有的信用账户数量等。
  3. 信用历史长度(15%):持开放信用账户的时间越长,FICO得分越高。
  4. 信用类型(10%):借款人的信用类型包括抵押贷款、汽车贷款和信用卡。
  5. 新信用账户(10%):最近申请信用、结清账户或增加余额等因素。

信用评分与“隐形信用”

所有这些因素都需要事先获得信用额度,因此传统的信用评分常常成为“隐形信用”进入的障碍。根据美国消费者金融保护局(CFPB)的数据,2015年有2600万美国人属于“隐形信用”,占美国人口的近十分之一。此外,CFPB发现低消费社区的消费者更有可能没有信用记录或当前信用记录不足,无法生成信用评分。

这些人最有可能需要贷款购买大件商品,但由于缺乏信用记录,他们无法获得贷款和信用额度的批准。这就是所谓的“隐形信用”困境。

还有一些借款人的信用评分并不能准确反映他们对贷款机构的风险。例如,益百利(Experian)发现,千禧一代的平均信用评分为638,低于全国平均水平,也远低于前几代人。部分原因在于这些借款人的年龄和较薄的信用记录,这占FICO评分的30%。因此,放贷者可能会因为他们的评分过低而拒绝贷款,但实际上他们并没有带来太大的风险。他们还很年轻。

虽然FICO和传统的信用评分对年长的中产阶级美国人有效,但对于习惯使用借记卡购物的千禧一代和低收入美国人来说,这些评分可能不太适用。这些“隐形信用”的借款人不一定具有高风险,但由于缺乏信用评分,放贷者无法明确他们的风险,因此很少同意他们的贷款申请。

时间变化带来的挑战

FICO评分不会随着时间的变化而改变。ZestFinance认为,这使得FICO评分难以区分以下两种情况:

  • 一个人五年前的信用报告中有几笔滞纳金,但从那时起再也没有拖欠过,而另一个人在同一时期却频繁拖欠。

FICO和传统的信贷模式难以解释这两个借款人在时间变化中对其偿债能力的影响。尤其是对年轻人而言,这可能导致问题,因为他们很多人正处于负债状态。

根据益百利(Experian)的数据,大约四分之一的千禧一代认为他们缺乏良好的信用教育。同一项调查显示,15%的千禧一代经常错过信用卡付款。

他们可能在当前生活中找到了自己的财务基础,能够按时付款,但传统的信用评分并不会立即反映出来。这些借款人可能因为年轻时建立的不良信用记录而难以获得贷款,并且无法开设信用账户,导致他们的信用评分较低。再次,这是一个隐形信用的困境。

新的数据源可能是解决方案。

新数据源的应用

Budzik表示,FICO评分可能会纳入十几个或几十个变量,但ZestFinance为客户量产的模型中往往包含数百或数千个变量。该公司声称拥有一个包含2200个变量的模型,用于自动贷款业务。

更多的数据意味着更精细的信用模型,这些模型可以帮助承销商更准确地了解贷款申请人的风险。新数据源可能包括:

  • 未决案件的公共记录
  • 借款人希望购买的汽车品牌和型号
  • 借款人希望为其抵押的房产的卫星图像
  • 借款人在信用卡上购买的产品种类

这些数据类别可以间接反映贷款申请人的信用情况,但传统的信贷模型并未考虑这些因素。

机器学习的优势

根据Budzik的说法,为了考虑更多的变量,贷款机构需要新的算法来处理这些数据。机器学习提供了这样的方法。机器学习可以处理所有这些变量,而不会犯错误。传统的评分技术可能会受到数学相关性和局限性的限制。

通过机器学习,实际上可以计入信用模型的数据源数量是有限的。存在大量变量可以预测贷款申请人的还款能力,而机器学习擅长在大型数据集中寻找模式。基于机器学习的信用模型可能会考虑到未知的数据点,以预测借款人偿还贷款的可能性。

例如,ZestFinance与Discover合作,利用信用卡公司的消费者支出数据库,为其75亿美元的个人贷款业务建立了新的模型。ZestFinance声称该模型评估了数百个申请人的数据点,比Discover之前使用的信用模型多出十倍。

建模者发现,申请人在折扣店购物的历史增加了他们获得个人贷款的可能性,而申请人在贷款申请上写上雇主的法定全名则降低了这种可能性。

从座机或手机而不是Skype或其他互联网电话服务致电Discover的申请人被认为是更安全的选择,因为这些电话更容易追溯到个人。

此外,这些数据源的组合自身会创建新的数据点。例如,申请人为汽车购买配件的理想可能性并不会直接影响他们偿还汽车贷款的能力。然而,这一行为与申请人为购买车辆选择的品牌组合可能表明较低或较高的还款可能性,保险公司几乎无法弄清这种关系,但机器学习可以做到这一点。

此外,机器学习比传统的信用模型更具适应性。开发新的信用模型可能需要一年甚至更长时间,这可能阻碍银行跟上不断变化的经济形势的能力。

客户和市场可以快速变化。一些用于信用承销的机器学习软件带有自动风险管理功能,可以使得贷款机构在不到一个月的时间内调整模型,以适应经济发展的需求。

对贷款机构的意义

机器学习可以让银行和其他贷款机构通过批准更多的信用隐形申请人和更多信用评分不完整的申请人来增加支出。例如,ZestFinance声称已经通过基于机器学习的信用模型帮助Prestige Financial Services将贷款批准率提高了14%。

同时,贷款机构可以在不增加风险的情况下增加支出。承销商可以开始拒绝比其信用评分所暗示的风险更高的贷款申请。结果,贷款机构可以减少从这些借款人那里遭受的损失。

机器学习还可以实现更精确的风险定价。如前所述,与传统模型相比,基于机器学习的信用模型可以处理更多的数据,从而更详细地反映申请人的还款能力。结果,贷款机构可以更加精细化地为借款人提供利率。

机器学习可以弥补两个非常相似的借款人之间的巨大差异,而这些差异可能值得通过为一个借款人提供更高的利率来加以应用。这样可以增加每个借款人的利润率,而不增加承销商审查借款人申请的时间。从规模上看,贷款机构可能会看到支出的大幅增长。

对消费者的意义

依靠新数据源的机器学习模型可以以传统模型完全专注于信用历史的方式评估信用隐形申请人。基于机器学习的信用模型的结果是,申请人可能会发现贷款机构开始批准他们的申请,而这在以前是不可能的。信用记录薄弱的年轻人可能会有机会建立自己的信用,因为贷款机构可以开始注册他们。

同样,在未来,千禧一代可能会发现,过去的信用失误不会阻止他们在有能力偿还贷款时获得大额购买的贷款。

此外,Budzik指出:

贷款机构可以通过避免向将要违约的人提供贷款来避免麻烦,而不是同意这些人的贷款。通过向无法支付贷款的人提供信贷来制造问题是可以避免的,这对消费者也有好处。

如前所述,信用评分良好的贷款申请人可能会构成比其评分所反映的更大的风险。分数在700左右并违反法律的申请人可能会被迫在一年内分期付款。这样的判断可能会影响申请人偿还贷款的能力,影响其信用评分,并给他们的未来造成更长期的损害。

基于机器学习的信用模型会考虑未决案件,这可能表明承销商不会完全同意申请人,即使他们的信用评分表明他们值得贷款。放贷人可以通过不首先同意贷款来应对风险较高的消费者拖欠贷款的风险。

    本文来源:图灵汇
责任编辑: : 阙婷
声明:本文系图灵汇原创稿件,版权属图灵汇所有,未经授权不得转载,已经协议授权的媒体下载使用时须注明"稿件来源:图灵汇",违者将依法追究责任。
    分享
保险业信誉评分用于能够机器当前分析
    下一篇