互金公司的数据风控都是在控什么?

2017 年 9 月 17 日 互联网er的早读课 竹影清风315
数十万互联网从业者的共同关注


者:竹影清风315

来源:海思细语(ID:lanzaisay)

编辑:Verna


金融指货币的发行、流通和回笼,贷款的发放和收回,存款的存入和提取,汇兑的往来等经济活动。金融的本质是风险管理,风控是所有金融业务的核心。


随着互联网技术和大数据技术发展,互联网+金融的业务开展越来越多。而风控肯定也不甘落后,大数据风控近几年也飞速发展。


大数据风控并不是完全改变传统风控,实际是丰富传统风控的数据纬度。互联网风控中,首先还是利用信用属性强的金融数据,判断借款人的还款能力和还款意愿,然后在利用信用属性较弱的行为数据进行补充,一般是利用数据的关联分析来判断借款人的信用情况,借助数据模型来揭示某些行为特征和信用风险之间的关系。


互联网金融公司利用大数据进行风控时,都是利用多维度数据来识别借款人风险。同信用相关的数据越多地被用于借款人风险评估,借款人的信用风险就被揭示的更充分,信用评分就会更加客观,接近借款人实际风险。


1.验证借款人身份


借款人身份四要素认证是必须的,分别是姓名、手机号、身份证号、银行卡号。可以借助公安数据来验证姓名、身份证号,借助银联数据来验证银行卡号和姓名。


如果借款人是欺诈用户,这几个信息都可以买到。这个时候就需要进行人脸识别了,人脸识别等原理是公安局API接口,将申请人实时拍摄的照片同客户预留在公安的身份证进行识别,通过人脸识别技术验证申请人是否是借款人本人。


其他的验证客户的方式包括让客户出示其他银行的信用卡及刷卡记录,或者验证客户的学历证书和身份认证。


2.分析提交的信息来识别欺诈


现在的现金贷,一般只需要提交身份认证信息就可以,其他的靠互联网上的数据进行判断是否是欺诈用户,比如风险名单数据、设备欺诈判别或者运营商等数据的引入。但如果额度稍微高,会要求填写多维度信息例如户籍地址,居住地址,工作单位,单位电话,单位名称等。如果是欺诈用户,其填写的信息往往会出现一些规律,企业可根据异常填写记录来识别欺诈。例如填写不同城市居住小区名字相同、填写的不同城市,不同单位的电话相同、不同单位的地址街道相同、单位名称相同、甚至居住的楼层和号码都相同。还有一些填写假的小区、地址和单位名称以及电话等。


3.分析客户行为来识别欺诈


一般可以从填信息的行为来看:


欺诈用户往往事先准备好用户基本信息,在申请过程中,快速进行填写,批量作业,在多家网站进行申请,通过提高申请量来获得更多的贷款。


企业可以借助于SDK或JS来采集申请人在各个环节的行为,计算客户阅读条款的时间,填写信息的时间,申请贷款的时间等,如果这些申请时间大大小于正常客户申请时间,例如填写地址信息小于2秒,阅读条款少于3秒钟,申请贷款低于20秒等。用户申请的时间也很关键,一般晚上11点以后申请贷款的申请人,欺诈比例和违约比例较高。这些异常申请行为可能揭示申请人具有欺诈倾向,企业可以结合其他的信息来判断客户是否为欺诈用户。


也可以从互联网行为来看:


比如在其他的同行业公司骗贷,设备欺诈,网上的行为经常与黑产、黑中介、诈骗纠合在一起,肯定也是存在很大的风险的。


4.利用风险名单识别风险


互联网金融公司面临的主要风险为恶意欺诈,70%左右的信贷损失来源于申请人的恶意欺诈。客户逾期或者违约贷款中至少有30%左右可以收回,另外的一些可以通过催收公司进行催收,M2逾期的回收率在20%左右。


市场上有近百家的公司从事个人征信相关工作,其主要的商业模式是反欺诈识别,风险名单识别,以及客户征信评分。反欺诈识别中,重要的一个参考就是风险名单,包括黑名单和灰名单。


黑险名单来源于民间借贷、线上P2P、信用卡公司、小额借贷等公司的历史违约用户,其中很大一部分不再有借贷行为,参考价值有限。另外一个主要来源是催收公司,催收的成功率一般小于于30%(M3以上的),会产生很多黑名单。同时还有很多犯罪、黄赌毒等名单。


灰名单是逾期但是还没有达到违约的客户(逾期少于3个月的客户),灰名单也还意味着多头借贷,申请人在多个贷款平台进行借贷。总借款数目远远超过其还款能力。


风险名单是很好的风控方式,但是各个征信公司所拥有的名单仅仅是市场总量的一部分,很多互联网金融公司不得不接入多个风控公司,来获得更多的风险名单来提高查得率。央行和上海经信委正在联合多家互联网金融公司建立统一的黑名单平台,但是很多互联网金融公司都不太愿意贡献自家的风险名单,这些风险名单是用真金白银换来的教训。另外如果让外界知道了自家平台风险名单的数量,会影响其公司声誉,降低公司估值,并令投资者质疑其平台的风控水平。


5.利用设备数据识别欺诈


行为数据中一个比较特殊的就是移动设备数据反欺诈,公司可以利用移动设备的位置信息来验证客户提交的工作地和生活地是否真实,另外来可以根据设备安装的应用活跃来识别多头借贷风险。


欺诈用户一般会使用模拟器进行贷款申请,移动大数据可以识别出贷款人是否使用模拟器。欺诈用户也有一些典型特征,例如很多设备聚集在一个区域,一起申请贷款。欺诈设备不安装生活和工具用App,仅仅安装和贷款有关的App,可能还安装了一些密码破译软件或者其他的恶意软件。


欺诈用户还有可能不停更换SIM卡和手机,利用SIM卡和手机绑定时间和频次可以识别出部分欺诈用户。另外欺诈用户也会购买一些已经淘汰的手机,其机器上面的操作系统已经过时很久,所安装的App版本都很旧。这些特征可以识别出一些欺诈用户。


6.利用数据进行评分


大数据风控除了可以识别出坏人,还可以评估贷款人的还款能力。过去传统金融依据借款人的收入来判断其还款能力,但是有些客户拥有工资以外的收入,例如投资收入、顾问咨询收入等。另外一些客户可能从父母、伴侣、朋友那里获得其他的财政支持,拥有较高的支付能力。


按照传统金融的做法,在家不工作照顾家庭的主妇可能还款能力较弱。无法给其提供贷款,但是其丈夫收入很高,家庭日常支出由其太太做主。这种情况,就需要消费数据来证明其还款能力了。


常用的消费记录由银行卡消费、电商购物、公共事业费记录、大宗商品消费等。还可以参考航空记录、手机话费、特殊会员消费等方式。例如头等舱乘坐次数,物业费高低、高尔夫球俱乐部消费,游艇俱乐部会员费用,奢侈品会员,豪车4S店消费记录等消费数据可以作为其信用评分重要参考。


互联网金融的主要客户是屌丝,其电商消费记录、旅游消费记录、以及加油消费记录都可以作为评估其信用的依据。有的互联金融公司专门从事个人电商消费数据分析,只要客户授权其登陆电商网站,其可以借助于工具将客户历史消费数据全部抓取并进行汇总和评分。


7.参考社会关系评估信用情况


物以类聚,人与群分。一般情况下,信用好的人,他的朋友信用也很好。信用不好的人,他的朋友的信用分也很低,参考借款人常联系的朋友信用评分可以评价借款人的信用情况,一般会采用经常打电话的朋友作为样本,评估经常联系的几个人(不超过6六个人)的信用评分,去掉一个最高分,去掉一个最低分,取其中的平均值来判断借款人的信用。这种方式挑战很大,只是依靠手机号码来判断个人信用可信度不高。一般仅仅用于反欺诈识别,利用其经常通话的手机号在黑名单库里面进行匹配,如果命中,则此申请人的风险较高,需要进一步进行调查。


8.参考社会属性和行为评估信用


参考过去互联网金融风控的经验发现,拥有伴侣和子女的借款人,其贷款违约率较低;年龄大的人比年龄低的人贷款违约率要高,其中50岁左右的贷款人违约率最高,30岁左右的人违约率最低。贷款用于家庭消费和教育的贷款人,其贷款违约率低;声明月收入超过3万的人比声明月收入低于1万5千的人贷款违约率高;贷款次数多的人,其贷款违约率低于第一次贷款的人。


经常不交公共事业费和物业费的人,其贷款违约率较高。经常换工作,收入不稳定的人贷款违约率较高。经常参加社会公益活动的人,成为各种组织会员的人,其贷款违约率低。经常更换手机号码的人贷款违约率比一直使用一个电话号码的人高很多。


午夜经常上网,很晚发微博,生活不规律,经常在各个城市跑的申请人,其带贷款违约率比其他人高30%。刻意隐瞒自己过去经历和联系方式,填写简单信息的人,比信息填写丰富的人违约概率高20%。借款时间长的人比借款时间短短人,逾期和违约概率高20%左右。拥有汽车的贷款人比没有汽车的贷款人,贷款违约率低10%左右。


总之,互联网金融的大数据风控采用了用户社会行为和社会属性数据,在一定程度上补充了传统风控数据维度不足的缺点,能够更加全面识别出欺诈客户,评价客户的风险水平。


Read More

投稿邮箱:mm@zaodula.com

本文由作者授权早读课发表,转载请联系作者。


优秀人才不缺工作机会,只缺适合自己的好机会。但是他们往往没有精力从海量机会中找到最适合的那个。

100offer 会对平台上的人才和企业进行严格筛选,让「最好的人才」和「最好的公司」相遇。

扫描下方二维码,注册 100offer,谈谈你对下一份工作的期待。一周内,收到 5-10 个满足你要求的好机会!



登录查看更多
2

相关内容

干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【浙江大学】人脸反欺诈活体检测综述
专知会员服务
31+阅读 · 2020年4月15日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
90+阅读 · 2019年11月13日
关系图谱在贝壳找房风控体系的应用与实践
DataFunTalk
49+阅读 · 2020年2月12日
【数据中台】什么是数据中台?
产业智能官
17+阅读 · 2019年7月30日
金融风控面试十二问
七月在线实验室
18+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
34+阅读 · 2019年3月15日
金融风控背后的技术综述
七月在线实验室
44+阅读 · 2019年2月28日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
OD-GCN: Object Detection by Knowledge Graph with GCN
Arxiv
4+阅读 · 2019年9月30日
Arxiv
5+阅读 · 2018年1月23日
Arxiv
3+阅读 · 2017年12月14日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关VIP内容
干净的数据:数据清洗入门与实践,204页pdf
专知会员服务
160+阅读 · 2020年5月14日
【浙江大学】人脸反欺诈活体检测综述
专知会员服务
31+阅读 · 2020年4月15日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
【白皮书】“物联网+区块链”应用与发展白皮书-2019
专知会员服务
90+阅读 · 2019年11月13日
相关资讯
关系图谱在贝壳找房风控体系的应用与实践
DataFunTalk
49+阅读 · 2020年2月12日
【数据中台】什么是数据中台?
产业智能官
17+阅读 · 2019年7月30日
金融风控面试十二问
七月在线实验室
18+阅读 · 2019年4月9日
【智能金融】机器学习在反欺诈中应用
产业智能官
34+阅读 · 2019年3月15日
金融风控背后的技术综述
七月在线实验室
44+阅读 · 2019年2月28日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
关注人工智能:人工智能+ 金融添双翼
专知
5+阅读 · 2018年2月5日
【区块链】区块链是什么?20问:读懂区块链
产业智能官
8+阅读 · 2018年1月10日
Top
微信扫码咨询专知VIP会员