卷积神经网络在个人信贷风险管理中的应用

2018 年 8 月 29 日 数盟

机器学习目前实际应用较广的主要在图像识别（例如人脸识别、无人驾驶等）及其衍生领域，而随着数据的积累，图像本身也可抽象对应更多行业。例如目前互联网金融行业中的大数据风控，也在通过一些前沿算法来描绘客户画像，从而建立更敏锐的风险识别机制。今天我们以网贷平台人人贷内部关于卷积神经网络的分享为例，来看金融科技在个人信贷风险管理中能够发挥的作用。文章作者为人人贷所属集团友信金服首席技术官蓝晏翔和人人贷政策审核部总监叶赛尔：

关于金融科技的定义

按照国际金融稳定理事会（FSB）的定义，金融科技是指技术带来的金融创新，它能创造新的模式、业务、流程与产品。这些创新既包含前端产业也包含后台技术，它是对传统金融的挑战和变革。从创新的主体上看，有两类机构发挥了重要作用，一类是传统金融机构基于自身多年对于金融业务和金融场景的深刻理解，引入先进技术进行金融创新；一类是新兴的科技企业基于自身在数据、计算和算法能力的积累，渗透至金融领域进行金融创新。其中，风险管理的创新是金融科技的核心创新之一。

个人信贷风险管理的传统流程

个人信贷客户的风险管理包括贷前审核、贷中监控和贷后管理等阶段。具体到贷前审核，传统的风险管理流程大致可分为以下几个部分：

一，定客群。不同的目标用户和信贷需求基本决定了金融产品形态，即产品的额度、期限、费率、准入门槛、营销渠道、资金渠道等各个要素。以经营类贷款为例，如果以微型个体工商户为目标，一般情况下其经营规模较小，难有相对大额抵押物，对于资金规模的需求也相对较小，适合通过P2P网贷模式为其提供基于个人信用的无抵押（20万以下）信贷产品；倘若以稍具规模的中小企业为目标，由于其具备一定的固定资产，资金需求达到百万以上，抵押可以成为贷款产品中的必备环节，同时需对企业资质进行全方位的评估，适合银行等机构通过传统的审核模式提供服务。机构必须综合多方面因素，在“了解你的用户（KYC）”的基础上，审慎积极地设计富有竞争力的产品，避免产品形态和目标用户的不匹配而造成产品盈利性不佳或者客户的“逆向选择”。

二，反欺诈。一般来说，“欺诈攻击”的形式主要体现在两个方面，一类是申请资料的造假，不法分子为了获取贷款，会对申请资料进行包装，以求通过审核；一类是申请身份造假，不法分子冒用他人身份申请信贷。为了防范欺诈风险，传统金融机构一般通过调取可信数据源进行多方数据交叉核验、客户经理与借款用户线下面谈、人工电话核实等手段来防范欺诈风险，保证借款人的真实性和申请资料的真实性。

三，信用评估。在传统的信用评估领域，评分卡（score card）是一个被广泛使用的技术和方法。评分卡根据用户的申请资料对用户进行打分，根据用户最终的得分决定是否给用户授信。以下是一张典型的评分卡示例：

在使用时，用户提交的每项相关资料都会获得相应的分数（例如用户年龄25岁，在评分卡中得分90分），各项资料对应分数的总和就是用户的最终得分。机构根据用户得分的高低划分用户等级，进而决定是否给用户授信。

可以看见，评分卡非常地稳定、简洁、直观，这使得建模人员能够快速核验评分卡是否符合金融经验和业务逻辑，并根据经验对于评分卡进行调整。在使用评分卡时，用户的得分是用户各项得分的线性相加，适用于因变量（客户信用资质）和自变量（用户申请资料）之间满足线性关联的情形，例如一般认为用户的收入和还款能力之间存在正线性相关。

需要注意的是，评分卡的有效性是基于数据上的一些强假设：因变量和自变量之间满足线性关联。而在现实情况中，采集的自变量和因变量之间常常不满足简单的线性关系。在这种情况下，我们常常采用多种变量衍生和变换技术来弥补线性模型表达能力的不足。例如，在央行征信报告上会列出用户的征信报告被贷款机构查询的记录，单条的查询记录可能跟用户的资质没有太大关联，但是，如果我们统计用户在一定期限内的被查询次数，这就是用户对于贷款饥渴程度的一个很好的度量，也跟用户的资质有较大的关系。

在这里，“用户的征信报告被贷款机构查询的记录”到“用户一定期限内的被查询次数”就是一次非线性的变量衍生过程。在变量衍生后，数据分析人员以标准的变量评估方法为基础，结合KYC的经验判断衍生和变换后的变量是否是一个“好”的变量。数据分析人员的经验、能力甚至灵感决定了能否找到良好的非线性变换，以对用户的资质做更准确的评价。

由于数据分析人员的经验和精力有限，理论上我们总可以找到更好的变量变换，对用户的资质给出更准确的评价。其次，传统的方法依赖富有经验的数据分析人员，这使得此类方法的规模性和可复制性上都存在局限。从另一方面来说，随着移动互联网和大数据技术的发展，我们获得了海量的新数据，这些数据具有量大、庞杂、非结构化等特征，这给数据分析人员带来了很大的挑战：如何从海量纷繁的非结构化数据中衍生和构造出复杂的非线性映射，使得映射后的变量能够应用在线性模型为基础的评分卡中？

上述挑战正是近年来机器学习技术的擅长之处。一般来说，机器学习领域算法通常对数据有较少的假设限制，从而具有灵活、高效、精确度较高的特点。但另一方面，算法学习出来的复杂的非线性映射使得拟合结果的可解释性较低。例如在机器学习算法“随机森林”中，我们使用一系列决策树的决策结果的平均值作为模型的输出，原始变量在各个决策树中多次出现，我们难以直观解释原始变量在模型中起到什么作用。这也使得模型使用过程中的监测难度相应增加。例如使用过程中发现模型偏移，数据分析人员无法直观定位导致偏移的原因，增加了模型维护的成本。

鉴于以上原因和金融场景下的种种特殊性，我们不建议将机器学习类算法直接应用于申请人信用评估的线上主流程中，但我们希望能借助算法的强大学习能力，为我们在茫茫数据海洋中挖掘出有价值的信息，指导和辅助建模前的变量衍生和变换工作，高效、科学地提取、组合有效变量，从而提升主流程评分卡的预测能力，而不是替代它。

卷积神经网络CNN在变量衍生中的应用

我们以机器学习中很流行的卷积神经网络算法的应用为例，来阐述以上思路。神经网络算法的设计灵感源于人类大脑的神经系统。如下图所示，

传统神经网络由一系列人工构造相互连结的“神经元”构成，多层神经元之间互相逐层前向全连接（即连接中没有“回路”），完成输入信息的特征识别与处理。在这里，网络的输入信息是用户的原始变量，输出是用户的资质情况。神经网络模型需要刻画的情况越复杂，所包含的神经元层数会越多，用到的参数和计算时间也相应增加。

卷积神经网络（Convolutional Neural Network，简称CNN）是神经网络算法的一种。与传统神经网络相比，CNN模型在传统神经网络之前加入了 “卷积层”。“卷积层”是对输入信息的“变换”,变换的宗旨是观察输入信息的局部特征，利用对局部特征的刻画来达到降低维度、减噪、提升预测效率的目的。目前，CNN最成功的领域是图像识别。以如下两张图片为例，我们需要识别出图片中的小鸟。CNN意识到能否正确识别小鸟，并不依赖图像在图片中的位置，而依赖图像本身的形状（例如小鸟的喙）；除此之外，CNN还意识到成功的图像识别需要将图像与背景分离，消除背景带来的噪音。这正是CNN的“卷积层”的工作。和传统神经网络相比，CNN的“卷积层”成功抽取了图像（小鸟）的相关特征（喙），使得它的学习效率和精度上大大提升。据此，我们可以对适用CNN算法的数据特征进行总结：数据本身包含不因噪声、位置或其他外力导致失真的具有指示能力的特征；且不同来源的特征在某种维度上存在较强的相关性或一致性，可以减少特征数量并增强整体的预测能力（例如鸟和哺乳动物最大的区别在于鸟有喙，通过局部识别鸟喙，可以更容易地区分图像中的动物属于鸟类还是哺乳类）。

类比图片识别的例子，在信贷领域，假设我们将采集到的用户数据可视化为一张图片，其中的每一个像素定义为每一个变量的取值，那么通过批量分析用户图片，我们可以发现高风险用户在某些图片区域上有持续的共同或相似之处，体现出基本的“图片轮廓”；同时，我们也会发现一些图片区域的取值，在高风险和低风险的用户之间并无差异，即在风险识别的目标下无效的变量区域。

综上，我们认为在信贷风险管理领域，存在成功应用CNN的前提条件。需要说明的是，我们并不是运用CNN来完成风险决策，而是将CNN用于传统信用评估流程中的“变量衍生”环节，具体地说，我们将考察训练完成后的CNN网络“卷积层”的输出，作为衍生变量的重要选择。

机器学习不能独立完成信审决策

为了验证我们的推论，我们进行了相关的数据实验。我们选取了一万个借贷用户样本，以及他们来自不同数据源的收入支出、共债信息及社交情况共三大类信息，每类信息10个变量，共30个变量。同时，我们提取他们的还款行为作为风险标签。我们评估CNN算法对这30个变量组合选择的有效性，以业界通用的风险相关性度量（Information Value，简称IV）作为变量对风险预测力的评估标准，即IV越高的变量与风险的相关性越高，从而具有更强的预测能力。

30个原始变量的IV值倒序结果如表1展示（变量本身进行了脱敏），我们发现，预测能力最强的变量具有IV值0.170（var7，即变量7）。

我们接下来用CNN作用于这30个变量，观察CNN作用于这30个变量后在其变量变换阶段的输出变量。我们取出IV值最高的10个变量（如表2）。可以看到，其中最强变量的IV值从0.170提升到了0.300（64%的提升），同时我们的前10个衍生变量的IV值都超过了0.2(var_new是新的衍生变量)：

我们来对衍生变量做进一步的观察，以var_new1为例，它是两个共债相关变量的组合，即借款人过去24个月申请贷款的次数(a)和借款人过去3个月申请贷款次数(b)的加权平均，这两个变量在原始变量中分别对应var5（IV=0.15）和var13（IV=0.105），它们分别刻画了用户在较长时期内（24个月）和较短时期内（3个月）的借款需求。CNN将它们以最优的方式结合在一起，使得我们能描述用户的借款“饥渴度”在时间序列上的变化，从而获取单一变量无法提供的信息。

例如，我们观察到在过去24个月内有较高贷款次数、但是过去3个月内贷款次数低于平均值的用户群体，其风险表现显著优于单一观察过去24个月内有较高贷款次数的群体。CNN帮助我们量化挖掘出了这一“借款需求在过去几个月有明显缓解”的群体特征，从而使得我们能更精准地识别用户风险。我们可以看到，在庞大的变量库中，风险人员无法手动挑选变量进行组合（例如挑选var5和var13），更无法为他们的组合设置科学的权重值，而CNN自动、高效地为我们解决了这一难题。

从上一个例子中我们观察到CNN算法在变量选取、组合衍生中能发挥重要的作用，但是这并不代表我们可以将算法的输出直接代入最终的授信模型中，我们需要结合金融逻辑与业务经验对算法的输出进行筛选与精炼。以var_new8为例，它是几个短期内共债相关变量的组合，刻画了用户在短期内（比如6个月内）在各个类型的金融机构申请贷款的情况。在对var_new8做深入分析时，我们发现更严重的短期内共债对应了更好的还款行为。这一现象可对应多种解读，其中一种可能性是用户存在“借新还旧”的行为，短期内在多家平台申请贷款进行资金周转以维持还款。从纯粹的数据驱动角度出发，var_new8是一个优秀的预测变量（IV高达0.277），但是从金融逻辑与业务经验出发，这个变量的解释性较差，具有潜在风险，谨慎起见不应予以使用。

由此可见，借助于机器学习算法（例如CNN）的强大学习能力，结合我们对于用户和业务的理解，我们能够从纷繁的数据中学习到具有更强预测能力的变量。接下来，我们可以选择合适的模型算法，结合实际情况，进行下一步的风险建模工作。正如监管所言，要“谨慎使用‘数据驱动’的风控模型”，充分遵守KYC的原则。传统金融的可解释性经验依然有不可取代的价值，机器辅助下的人工决策，会是金融科技的一个重要发展方向。

识别下图二维码，加“数盟社区”为好友，回复暗号“入群”，加入数盟社区交流群，群内持续有干货分享~~

本周干货：探究Hindon的Capsules理论的实现行踪