金电联行征信事业部副总裁范文清:社会信用体系建设要将各种数据进行结合

2017 年 12 月 8 日 数据猿 范文清

12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。本文是数据猿整理“金电联行征信事业部副总裁范文清”的发言实录


作者 | 范文清

官网 | www.datayuan.cn

微信公众号ID | datayuancn


12月1日下午,由上海大数据联盟、数据猿主办的第20期魔方大数据在上海宝华万豪酒店成功举办。本期魔方大数据以“政务大数据”为主题,邀请了技术方和产业方大咖共聚一堂,共同探讨了政务大数据落地实施的有效路径。


以下是数据猿整理“金电联行征信事业部副总裁范文清”的发言实录:


我的演讲分两个部分。第一,金电联行的介绍。第二,社会信用体系建设的现状、问题和发展方向。


金电联行是一家大数据金融服务公司,已经成立十年了。成立的初衷是要彻底改变传统的信用评价模式和传统的信用评级方法。金电联行从2007年开始一直在研究如何明晰数据和利用众多的数据源,有关企业研究的核心指标达到了500个,主要指标有2000个。我们主要解决的是中小企业无抵押、无担保的纯信用贷款问题。


金电联行获得了人民银行的征信牌照,为工信部、科技部做了很多中小企业融资服务平台,在商业银行不认可小企业贷款时提供的第三方服务机构的报告的现实情况下,我们得到了50多家银行的承认。


我们有知识产权和着作权,拥有非常详细的算法模型,团队接近500人,跟清华、北大、复旦等国内一流高校共建了很多研究院,全国的分支机构有20多家,两度登上新闻联播,有上千次的媒体报道。数据来源有20多个部委、30多个地方政府、24个第三方数据公司,有70万中小企业的建模数据,7000万家企业的工商数据。金电联行有三大业务领域:政务大数据、金融大数据、产业大数据。核心技术有一站式征信、风险量化模型、数据工厂。



其实大数据行业不好做,难在什么地方呢?首先大数据公司要有大数据,但现在很多大数据公司没有自己生产的数据。国家也越来越重视数据安全,购买数据的使用范围和权限也越来越小。


二是技术,数据的收集有标准,数据经过存储、传输、加工、比对,最后才形成数据产品,技术是大数据公司的命脉,没有技术加工数据,数据就没得到应用,也就没有价值。


第三,资产,大数据越来越值钱,将来我们的资产负债表中会有一栏叫“数据资产”。


第四,时间,大数据公司需要时间解决实际问题,比如解决没有贷款抵押物的科技型企业或者中小企业贷款的问题。


国家现在的社会信用体系建设存在一些问题。现在建的比较多的是“一网三库一平台”,现在叫“一网多库多平台多应用”。网就是网站,诸如信用上海、信用浙江等。平台指数据交换平台。多库有企业信用库、个人信用库、重点行业库、重点人群库,包括地理信息、资源的信息都可以做到数据库里。还有应用,做得比较多的就是信用基准评价、公共信用信息共享、公共信用综合服务、公共信用移动应用等。


数据采集的协同机制建立难度大、难以形成联合奖惩机制、数据采集重地方轻全国,这是现有信用平台在数据采集方面存在的问题。数据收集有了,但是共享很困难。数据收集完以后还有标准问题,目前的标准很混乱,各个部门的标准都不一样,归类以后怎么去处理也是一个问题。最后是应用问题,现在数据应用的非常少,基本上都是红黑板,用来进行奖惩。但是上海、浙江做得不错,上海做了很多为民服务的应用,例如进行一些简单的查询。


大数据社会信用体系建设的解决方案有哪些?


我们做了很多案例,在实践中我们也产生了一些想法。比如数据要结合,政府数据要结合行业数据,小数据和大数据结合,静态和动态结合,微观和宏观结合,管理和服务结合,信用管理和信用服务结合。



要发挥大数据优势。发挥大数据优势要拓宽数据渠道,汇总区域数据、收集全国政务数据、抓取互联网数据、采集第三方数据和企业填报数据等,让真正的数据公司去整合各种各样的数据。还要进行动态数据的处理,数据工厂采集处理过数据后要提供服务。政府行政管理、企业商业服务、金融机构服务,这些要联合起来,应用空间要多维度。还有衍生服务,就是综合服务平台,为中小企业服务。


做征信查询。现在在社会信用体系方面的查询功能还不多,接下来的建设是一键式和一站式查询。汇总区域数据和26个部委、24家第三方数据公司的数据,只要输入企业名字就可以查询到企业的260多项信息,包括股东、投资、经营范围,还有族谱信息,谁投资了你的,你投资了谁。如何对企业评分?对企业评分需要大量的数据,我们做了五个基本大项,这五大项包括一类指标、二类指标、三类指标,未来会越做越细。还有利用政府数据和行业数据进行行业结构分析、企业活跃度分析、税收情况分析、环境分析、行政处罚分析,然后将报告提供给相关部门,这也需要大量的数据。信用体系还包括企业定位和行业定位,围绕一个园区或者地区优选企业,利用大数据技术,而不是人工去制定政府补贴政策。


互联网金融的监管问题越来越重要,现在政府非常关心集资、P2P行业、众筹,因为其中很容易出现问题。互联网金融是虚拟的,分散在全国,看不到具体的产品,也不知道它在什么地方,一旦出现问题风险会非常高,涉及的范围也广。针对这种现象,国家还没来得及出台相应政策,事前事中很难发现问题。互联网信息分散不容易获取,传统手段难以持续跟踪评估,一些传统做法对新金融没有效用,那么如何解决互联网金融监管问题?



首先要研究政策。虽然现在还没有现成的针对互联网金融的监管政策,但在已有的金融监管办法里面可以找到相关的。政策研究完了以后,要对目前的问题进行分类,先把公司的类别分清楚,是金融集团还是财富管理公司要搞清楚。比如金融集团是个房产集团,它的资金来源是P2P,下面有一个P2P做财富管理,资金进入集团后做房地产或者其他投资,这里面的资金流就要做好分类。分类以后用数据处理。一般这些公司都不会留下任何数据,网上的信息也不更新,有的假数据也看不出来,要收集数据建模,做长期跟踪。


这里讲三个建模,事前的分层分级,事中的数据比对,事后的动态跟踪。首先要有自己的数据,互联网数据、行业协会数据、互联网金融企业数据,然后实行方式是事前,事中、事后。事前将数据分层分级,搞清楚这些公司的业务方案。事中要建立模型,通过监管办法设立模型指标,除了监管指标外还附加有规模、能力、产品等指标。事后要随时跟踪。


风险预警排查指标怎么做?从经营指数、合规性指数、关联指数、舆情指数、平台指数、司法信息指数、传播力执法等几个方面进行,这是一级指数,一级指数后面还有二级、三级、四级指标。


互联网金融监管非常复杂,不是一夜之间或者一个指标就能解决的,需要我们慢慢摸索。今天我就分享到这里,谢谢大家!




延伸阅读:


梦创双杨大数据负责人杜国宁:产融大数据助力“双创”快速发展


市民云总经理王兆进:手机APP中的智慧城市


机遇与挑战并存 看政务大数据如何提升民生服务水平


登录查看更多
0

相关内容

从各种各样类型的数据中,快速获得有价值信息的能力,就是大数据技术。明白这一点至关重要,也正是这一点促使该技术具备走向众多企业的潜力。大数据的4个“V”,或者说特点有四个层面:第一,数据体量巨大。从TB级别,跃升到PB级别;第二,数据类型繁多。前文提到的网络日志、视频、图片、地理位置信息等等。第三,价值密度低。以视频为例,连续不间断监控过程中,可能有用的数据仅仅有一两秒。第四,处理速度快。
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
金融风控背后的技术综述
七月在线实验室
45+阅读 · 2019年2月28日
智能时代如何构建金融反欺诈体系?
数据猿
12+阅读 · 2018年3月26日
一个人的企业安全建设之路
FreeBuf
5+阅读 · 2017年7月7日
Arxiv
102+阅读 · 2020年3月4日
Arxiv
110+阅读 · 2020年2月5日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
25+阅读 · 2018年1月24日
VIP会员
相关VIP内容
商业数据分析,39页ppt
专知会员服务
160+阅读 · 2020年6月2日
2020年中国《知识图谱》行业研究报告,45页ppt
专知会员服务
239+阅读 · 2020年4月18日
报告 | 2020中国5G经济报告,100页pdf
专知会员服务
97+阅读 · 2019年12月29日
【德勤】中国人工智能产业白皮书,68页pdf
专知会员服务
303+阅读 · 2019年12月23日
【大数据白皮书 2019】中国信息通信研究院
专知会员服务
137+阅读 · 2019年12月12日
医疗知识图谱构建与应用
专知会员服务
384+阅读 · 2019年9月25日
相关论文
Arxiv
102+阅读 · 2020年3月4日
Arxiv
110+阅读 · 2020年2月5日
Meta-Transfer Learning for Few-Shot Learning
Arxiv
8+阅读 · 2018年12月6日
QuAC : Question Answering in Context
Arxiv
4+阅读 · 2018年8月21日
Arxiv
25+阅读 · 2018年1月24日
Top
微信扫码咨询专知VIP会员