金融风控背后的技术综述

2019 年 2 月 28 日 七月在线实验室


今天,和大家分享一篇文章,来自于我们【金融风控实战课】的梅老师所写的一篇关于金融风控背后的技术综述,以下是原文:


其实所谓的信贷风控,就是有人缺钱想贷款,来平台借钱。平台不知道这个人会不会借了钱就跑路,于是产生了相应的风控。涉及的技术也是主要围绕着衡量用户还款意愿展开的。


整个贷款业务流程其实内容很多,从资金方运营,数据采集到放款和催收。


风控的角度来看,基本上可以归结为以下几个部分:


数据采集、反欺诈、策略、模型、催收。


数据采集会涉及到埋点和爬虫技术,基本上业内的数据都大同小异。免费的运营商数据,和安卓可爬的手机内部信息(app名称,手机设备信息,部分app内容信息),以及收费的征信数据,外部黑名单之类的。还有一些特定场景的现金贷和消费金融会有自有的数据可供使用,比如阿里京东自己的电商数据、滴滴满帮的司机数据、顺丰中通的快递数据等等。


反欺诈引擎主要包括两个部分,反欺诈规则反欺诈模型。这里其实很少使用传统监督模型。涉及到的算法以无监督算法、社交网络算法、深度学习居多。大部分的公司都使用的是反欺诈规则,这也是主要提倡的。一个原因是欺诈标签不好得到,很难做监督学习的训练。还有一个原因是传统的机器学习对欺诈的检测效果很差。因为所谓欺诈,就是一些黑产或者个人将自己包装成信用良好的用户,进行借款后失联或者拒不还钱。既然都伪装成了好客户,基于风控人员主观思考建立的统计模型,又怎么可能有好的效果。但是经过一段时间的实验,这一块其实用深度学习反而有意想不到的效果,基本思想可以理解为,简单评分卡解释性强,带来的坏处就是可以被逆向破解,而复杂模型的黑箱操作虽然解释性差,却有一定的安全性,尤其是搭配了在线学习等动态手段之后。反向破解的成本极高


规则引擎其实就是我们常说的策略,主要通过数据分析、挖掘手段以及一些监督、无监督算法,得到不同字段、各个区间的坏账率(badrate),找到最佳分段区间,然后得到筛选后信用较好的一批特定人群进行放款。这一块主要有单变量分析和一些关键指标的计算和监控,比如Rollrate、PSI、KS、AUC,等等。


风控模型是机器学习在风控领域的主要体现。当然前面提到的反欺诈模型也是重点之一。主要是通过监督算法构建违约概率预测模型。但是因为实际业务中,是数据的质量并不是永远那么完美,这里通常我们会使用到深度学习、半监督学习、弱监督学习等等方法去辅助传统监督学习算法


风控模型其中包含了A/B/C卡。模型算法之间可以没有显著区别,而是根据其发生的时间点不同而进行划分的(贷前/贷中/贷后),也就是y产生的方式不一样。通常信贷领域都是用逾期天数来定义y。A卡可以用客户历史逾期天数最大的天数。B卡则可以多期借款中逾期最大的一次。C卡因为用途不同有不同的建立方法。比如你们公司有内催,有外催。外催肯定是回款率低,单价贵的。那么就可以根据是否被内催催回来定义y。


催收是风控的最终手段。这个环节可以产生很多对模型有帮助的数据。比如催收记录的文字描述、触达率、欺诈标签等等。并且坏账的客户会被列入黑名单。其实只要是能被催回来的,都不是坏账。但是很多公司为了保险起见,逾期超过一定时间的客户,即使被催回来,也会被拉入黑名单。这里主要的算法就是催收模型相关的,可能是监督算法、无监督算法。也有基于社交网络算法构造的失联模型等等。


可以看到这个领域的水究竟有多深,远不止逻辑回归制作评分卡那么简单。那么问题来了,究竟怎么样才能真正接触到这个领域的核心技术呢?


有个好消息要告诉你。由梅老师倾力打造的金融风控实战,终于在七月在线平台上线了,将为我们首次公开金融风控背后的技术


如果你对金融风控感兴趣...

如果你想成为风控从业者的一员...

如果你励志成为金融风控领域的大牛...


那么这一门课你非常有必要关注一下哦。


12大企业级实战项目为你保驾护航,帮你完成从小白到大神的完美蜕变。


下面是课程介绍



有意的亲们可以行动起来喽 

3人组团立减100元

咨询/报名/组团可添加微信客服

julyedukefu_02


长按识别下方二维码

查看更多课程详情

👇


长按识别二维码


往期推荐






我在GitHub上找到了中科大的计算机课程资源必读!

必备收藏!8500+公开代码论文,950多项机器学习任务最优结果汇总

2018最具突破性计算机视觉论文Top 10

春招已近,这份GitHub万星的ML算法面试大全请收下

不看后悔!2019年人工智能行业25大趋势


咨询,查看课程,请点击“阅读原文

给我【好看

你也越好看!

登录查看更多
45

相关内容

最新《多任务学习》综述,39页pdf
专知会员服务
265+阅读 · 2020年7月10日
基于深度学习的表面缺陷检测方法综述
专知会员服务
94+阅读 · 2020年5月31日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
236+阅读 · 2020年5月21日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
165+阅读 · 2020年2月27日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
202+阅读 · 2020年2月11日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
98+阅读 · 2019年12月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
五步帮你实现用户画像的数据加工
云栖社区
6+阅读 · 2018年2月4日
基于深度学习的电商交易欺诈检测系统
AI研习社
8+阅读 · 2017年9月26日
Arxiv
45+阅读 · 2019年12月20日
Arxiv
7+阅读 · 2018年1月10日
Arxiv
5+阅读 · 2017年12月14日
VIP会员
相关VIP内容
最新《多任务学习》综述,39页pdf
专知会员服务
265+阅读 · 2020年7月10日
基于深度学习的表面缺陷检测方法综述
专知会员服务
94+阅读 · 2020年5月31日
【实用书】Python技术手册,第三版767页pdf
专知会员服务
236+阅读 · 2020年5月21日
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
162+阅读 · 2020年5月14日
【综述】金融领域中的深度学习,附52页论文下载
专知会员服务
165+阅读 · 2020年2月27日
【新书】Pro 机器学习算法Python实现,379页pdf
专知会员服务
202+阅读 · 2020年2月11日
【阿里技术干货】知识结构化在阿里小蜜中的应用
专知会员服务
98+阅读 · 2019年12月14日
[综述]基于深度学习的开放领域对话系统研究综述
专知会员服务
80+阅读 · 2019年10月12日
相关资讯
金融风控面试十二问
七月在线实验室
20+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
35+阅读 · 2019年3月15日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
五步帮你实现用户画像的数据加工
云栖社区
6+阅读 · 2018年2月4日
基于深度学习的电商交易欺诈检测系统
AI研习社
8+阅读 · 2017年9月26日
Top
微信扫码咨询专知VIP会员