金融风控干货篇:失联模型

2019 年 7 月 22 日 炼数成金订阅号

失联对催收会产生非常大的阻碍,尽早了解客户是否失联对催收有很重要的意义。


简单来说,开发一张失联评分卡的目的有:

一是为了提前委外


二是为了信息修复


但是难点是:

客户是否失联的信息通常来源于催收结果,但准确定义失联客户是一个难题。


因为:单次催收联系上客户通常不能判断客户是否失联,比如客户手机信号弱而没有接听,导致催收人员跟客户联系不上的情况经常发生。


故对于是否失联需要综合一定的时间的催收结果进行判断,若该段时间内催收人员拨打多次电话,且在一天之内的不同时段反复拨打电话,均无法联系客户,才能判断为失联。


失联模型是基于历史数据,预测客户发生失联的可能性,希望将失联由事后发生编程提前预知。


但是失联模型的开发对于机构是一项重大的挑战,失联模型的预测变量变量通常需要结合金融机构内部的客户信息、交易信息催收信息、营销信息等,同时结合第三方信息来提供模型的预测能力,主要关注客户以下信息:

交易情况

贷款余额情况

额度占有情况

最近一次联系客户的情况

户籍信息

工作家庭情况

历史催收情况


一般的书籍介绍到这里就ending了……..前面讲了一大堆套话,水份太多了,如果只到这里大家是不是都要转身离开,有爱说不出来啊下面我们直接来挤水分吧..........


一、目前一般的公司里对失联的定义


二、真正开发好能进入失联评分卡的变量


失联的种类 

失联的定义跟一个公司的对客户的定义相关,你家大概允许客户在多长的时间窗口内失联。


一般公司会根据失联的情况,把失联种类称为失联完全失联,1-7天失联, TPC失联….


解释下这几个名词:

完全失联指的是客户完全联系不上


1-7天失联也就是客户在dayl-day7天内联系不上


TPC失联指的是拨打客户有关系第三方的联系人也联系不上


当然你可以根据公司具体的业务需求开发相关的失联时间窗口变量,思路已经提给给各位。


当然对应于实际的业务场景以下都是造成我们无法跟客户联系上具体场景:

无法接通

停机空号

拒绝关机

...等


下面再来上一个例子,比如一个公司是需要开发一个客户完全失联的评分卡模型,完全失联就是跟客户怎么样也联系不上。比如那我们跟客户联系了100个号码,前面99个都联系不上客户,只有最后一个才联系上了客户,对不起这样的场景还不能算完全失联。这个样本也就不能采纳了。


 失联变量 

介绍失联变量前,可先具体到一个具体的失联评分卡的开发案例。


具体的业务场景:

我们以一个线下消费贷的场景为例具体说明下,当一个客户处于dpd10天时候(思考为什么是预测dpd10天后的失联情况?因为客户经过前面9天的催收,已经有了9天的催收数据,相对会准一些),我们再预测未来5天后是否失联,也即预测客户在dpd16天是否会失联的概率。以下是敲黑板,划重点的时刻:

(有些变量在贷前的评分卡里,完全没想到)


是否BP

这个变量输出的是---客户承诺还款但是实际没有还的情况,这个比较好理解,无论在哪种催收卡评分卡里都是区分能力不错的变量。该变量只要1跟0两个取值


当前与上次联络时间差

这个变量入模,解释下很强,能联系上的时间越短,显然越不容易失联


委外标识

客群是否有提前被委外催收的情况,这个可在公司对应的其他产品里能关联上

与客户上次进入失联的时间差

rt,距离上次失联的情况怎样


年龄

没想到这个变量也能入模吧,年龄的变量也是有一定的区分能力,贷款的年龄


较大的贷款期数

这个变量获取比较容易,主要是客户的贷款时长


联系人RPC数量

有效联系人(一般指客户本人、父母、配偶、直系亲属)的数量

RPC是否有父亲,是否有母亲,是否有配偶


有效联系人里是否有直系亲属这些信息,可见在患难时刻都是亲人能站出来啊


客户填写移动的电话量

注意这里是移动电话而不是固话,因为在我这个数据里的表现来看,固话一般都比较容易掺杂着不太准确的电话,客户也比较从网络获取这些信息。


有同学会问,这个变量怎么能在线上的产品获取到吗?大家请注意,我们的命题已经假设了这个是一个线下消费贷的产品,填写的资料比线上的产品维度会丰富一些


近一天本人电话催收次数

这个催收人员跟客户联系的次数,证明客户被催的越多,接下来越可能消失


居住城市与银行卡城市是否一致

这个变量是个说透了也比较好理解的变量

...

...


最后分析下客户失联的原因是多种多样的,如提供虚假材料才得以贷款,因抵触催收故意不接电话、信息更新不及时等都可能造成客户失联,失联原因的复杂性和多样性给模型带来了很大困难。在此,建议信贷机构要求客户多填写相关信息,审核部门在贷前核实信息的真实有效性,以免日后催收时带来各种困难。


声明:本文版权归原作者所有,文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!


文章来源:信数金服

《金融的人工智能革命》将全面讲解金融行业的各个子领域面对的业务细节,并且以实际案例讲解其思路,建模,实现等完整过程。通过学习你可以自己动手揭开机器学习的神秘面纱,并应用到自己的实际业务中。点击下方二维码报名课程:

登录查看更多
1

相关内容

分布式并行数据库(DPD)在所有传统的以及新兴的数据库研究领域中发表论文,包括:数据集成、数据共享、安全和隐私、事务管理、流程和工作流管理、信息提取、查询处理和优化、分析大型数据集的挖掘和可视化、存储、数据碎片,放置和分配复制协议、可靠性、容错、持久性、保留、性能和可伸缩性以及各种通信和传播平台及中间件的使用。 官网地址:http://dblp.uni-trier.de/db/journals/dpd/
【实用书】流数据处理,Streaming Data,219页pdf
专知会员服务
76+阅读 · 2020年4月24日
【资源】100+本免费数据科学书
专知会员服务
107+阅读 · 2020年3月17日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
164+阅读 · 2020年2月27日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
97+阅读 · 2019年12月14日
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
金融风控背后的技术综述
七月在线实验室
45+阅读 · 2019年2月28日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
刘强东人设崩了,京东没崩
PingWest品玩
6+阅读 · 2018年11月20日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
互联网金融中的交易反欺诈模型
炼数成金订阅号
14+阅读 · 2018年3月9日
Arxiv
14+阅读 · 2019年11月26日
Arxiv
7+阅读 · 2018年1月10日
VIP会员
相关VIP内容
相关资讯
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
金融风控背后的技术综述
七月在线实验室
45+阅读 · 2019年2月28日
蚂蚁金服微服务实践(附演讲PPT)
开源中国
18+阅读 · 2018年12月21日
刘强东人设崩了,京东没崩
PingWest品玩
6+阅读 · 2018年11月20日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
互联网金融中的交易反欺诈模型
炼数成金订阅号
14+阅读 · 2018年3月9日
Top
微信扫码咨询专知VIP会员