[导读]本文选自百融金服CEO张韶峰和CRO季元于2017年9月14日晚在清华大数据“技术·前沿”系列讲座——大数据与AI技术在金融科技的应用上的分享。两位学长结合自己在金融行业和金融科技领域多年的探索,结合金融领域的反欺诈、信用风险识别、不良资产催收、精准营销等业务场景,深入浅出地阐述对抗生成网络、迁移学习、强化学习等方法的金融行业建模实践。
百融金服CEO张韶峰
百融金服CRO季元
张韶峰:首先非常激动能够回到母校跟各位校友,还有各位朋友,来分享这次报告。我们进入到金融科技领域是2012年,我们最早跟银行交流,想推动我们公司用机器学习算法作为模型在银行应用,银行那时候习惯运用的算法叫逻辑回归算法(Logistic regression algorithm),是一种比较简单的算法。但是我坚定地认为数据有用,至于有什么用,其实想不清楚,只是后来遇到金融行业的大爆发、变革,才发现数据在金融领域的应用那么直接。
金融领域一个非常重要的支柱就是信用体系。中国还有七八亿有金融需求的人没有信用记录,这是制约中国所谓普惠金融,刺激小微企业发展、消费发展,这是属于基础设施的问题。
大数据应用分层
从大数据行业来看,有些是共通的。
第一步,收集数据。
第二步,数据处理。把数据进行标准化,清洗脏数据、不准的数据,或者做一些脱敏。
第三步,数据降维。如果表格的每一行是一个用户,一个表的列数多达50万列,这是非常庞大的一个维度,处理起来会导致效率下降,需要做一些数据的降维,需要做一些衍生变量。
第四步,数据建模。金融里有两个模型最重要:第一类是营销获客模型,预测什么人需要什么样的金融服务,主要是预测客户的需求。第二类是风控模型。
第五步,大数据应用。不同的行业做的应用不同。
金融行业可以在哪些方面具体使用呢
第一步,解决精准营销。找好的而且有需求的客户,这两个标准要叠加。金融行业的精准营销难度远远超过普通消费品,这是金融行业精准营销的特殊性。
第二步,准入。他如果来申请你的贷款,或者买你的保险,你能不能把他放进来?你得审批一次。比如你去银行办个贷款,或者办一个信用卡,让你填一大堆资料。
第三步,存量客户的经营或者贷中管理。
第四步,逾期。这是贷后管理。
从营销、准入、经营、逾期,这四步每一步都可以充分使用大数据和人工智能算法来提升效率。
我们完善了一套反欺诈引擎评分,评估你有多大概率会欺诈。规则是遇到什么情况要采取什么措施。模型是抽像出决策逻辑以及跟欺诈相关的数据。
我们为金融机构提供定制化的服务,因为你的产品和你的客户跟别的金融机构不可能一模一样。我们的模型可以有差异化,数据的准备、初步筛选、交验检验,筛选相关性比较高的变量、数据的分段,最后建立模型。
我们用一些可视化的算法使金融机构和我们监管人员看得更清楚,规则有没有命中,客群分布怎么样。在客观的分数段中,比如我们公司是300分到1000分,比如700分的人对应100个人里只有3个人违约,而500分的人对应100个人里头有7个人违约,不同的分数段意味着不同的违约率,这个时候你就知道我应该给700分以上的放贷。这个评分对金融机构很重要,你算清楚每给500分的人放款一万块钱出去会亏多少钱,评分系统会帮你预测。
随后,百融金服CRO季元先生与大家分享了具体的应用案例。
案例一:图深度学习应用于团伙欺诈侦测
季元:百融在群体欺诈的跟踪、反欺诈方面主要通过无监督-异常行为监测,还有通过监督学习-地理位置异常分析(Geohash)
,具体的实现方式是通过图特征学习算法。
这是图特征学习算法大概的框架。因为我们输入的是我们客户图的特征,这张图包括边和点,图的拓谱和节点的这些属性构造了客户的基本特征。通过深度神经网络,从这些基本特征出发衍生出更复杂的特征。最终我们输出的是什么?一个是衍生后的特征,再一个是观察,观察为了从基础端衍生数学特征,把这个算法形成好东西移植到其他部分。
左边这个表是我们常用的一些特征算子。这个图反映了某个局部的具体的阶段,百融从DI特征出发通过Faier做衍生,衍生出新的特征。这个算法其实有四个优点:
第一它支持不同的属性图,因为通常我们的图只是节点和边,只能反映拓扑结构;
第二它能输出复杂关系函数用于跨网络迁移学习;
第三它能够学习出稀疏特征。
第四它支持并行,算法效率高。
这是我们某个客户在2017年1月到5月份的用户申请数据,申请次数34万,用户数4.7万,总共70个特征。通过我们的算法识别出了它有12000多欺诈用户,隶属于238个团体。
案例二:强化学习应用于催收模型构建
在你借了金融机构的钱之后,如果你一旦逾期不还钱,这个时候金融机构在内部是按照你逾期的时间给你划分的,M1代表逾期一个月,M2是两个月,在不同的逾期时间,它会给你不同的催收动作。
我们应该从序列的观点看,因为不同的人对不同动作的响应是不一样的。实际上你每一步的动作都会影响到后续的结果,应该以整个过程的最大的回馈,来决定我们在什么环节采取什么样的动作。这块我们就把催收过程定义成一个马尔科夫决策过程。
通过强化学习来求解马尔科夫决策过程。首先要定一个价格函数,其次就是你在不同时间段收回的钱,用折现因子折算到当前来看你的最大值,我们要求价值函数的最优点,这个算法是通过价值迭代来实现。
案例三:迁移学习应用于客群评分构建
我们的信用评分体系包括一个通用评分加上6个客群评分,通用评分类似于芝麻评分。这个评分在金融机构是怎么用的呢?我们可以看到这个图,柱状图表示不同分数段人数的占比,线图是不同分数段人数的的违约率,我们看到最低的300分数段违约率达到20%以上,最高的700分以上的不到1%。所以一个金融机构如果选择了500分以上的人,那么就意味着500分左边的这些人他都要拒绝掉,而且如果只要500分以上的人的不良率在8%以下,如果他想降低不良率,比如降低4%,那就意味着他要提高准入标准,可能把准入的门槛提高到600或者更高。
这是我们的6个客群评分,这个评分实际上对金融机构来讲非常重要,因为大家希望我们把坏人全过滤掉,好人全放进来,这是不可能实现的。现实中我们的评分通常居于两者之间,我们的目标是尽可能的靠近最好的那个部分。除了这7个标准评分之外我们还有定制产品,刚才邵峰介绍的给客户做定制化的建模,因为好的客户希望结合他的内部数据和我们百融数据一起构建一个专属于他的评分,这样效果会比标准评分更好。
在信用评分构建的过程中存在一些现实问题,在讲这些问题之前我先给大家简单介绍一下什么叫迁移学习。两个基本概念:
第一个是域,域实际上包括两个元素,X是特征区间,这些变量的维度, P(X)是特征空间上的概率分布,实际上是我们的样本和这些特征的分布。
第二个是任务,任务包括一个标签空间,是在样本特征空间上好或者坏甚至更多的内容,属于监督学习的一部分。
我们知道域和标签空间来求这个条件概率。
在迁移学习里面需要两个域和目标,一个是源域和源任务,一个是目标域和目标任务。按照刚才定义我们现在有四种情况:
第一,源域的特征空间和目标域的特征空间不同;
第二,边际概率分布不同;
第三,标签空间不同;
第四,条件概率不同。
这四种组合起来就是16个,但是现实生活中这16种组合不会都存在。包括比较典型的就是这三类:
第一种是线上客群和线下客群,它们的特点不一样,因为线上客群我们能采集的特征的维度更多;
第二种是同产品不同机构的客群,主要体现在边际概率分布和条件概率分布;
第三种是同机构不同产品的客群,主要是特征空间和条件概率不一样。
我们建模过程中碰到的比较现实的问题,有些客户不会告诉你标签空间,那这种情况下怎么建模?
第一步,通过域适应算法对源目标域的特征进行降维处理。
第二步,构造边际分布实验。构造一个函数来刻画源域和目标域的边际分布的差异,度量两个概率分布的差到底有多大。
第三步,策划条件分布实验。识别源任务的条件概率和目标任务的条件概率的差。
第四步,基于前两步构造目标函数做优化。
第五步,进行迭代运算。
案例四:知识图谱应用于贷前反欺诈
知识图谱本质上是一个语义网络,在人工智能里一直有两个流派,一个叫连接主义,我们第一个案例里面讲的深度神经网络属于连接主义,它是模拟人脑的硬件结构,本质上是统计学。第二个流派叫符号主义,知识图谱就归属于符号主义,它模拟的是人脑的推理方式,实际上是人脑软件。这两种流派实际上一直并行,上世纪五六十年代人工智能刚兴起的时候是符号主义领先,近年来随着计算能力的提升,连接主义开始突起。
知识图谱相当于你要把人的经验做知识表示和推理,所以你要把经验固化成知识图谱,通过这些语义的运算来做反欺诈判断。我们通常把推理分为:不一致性验证;机构异常分析。
未知性的验证,比方说两个人用的是同一个单位电话,但是写的单位名称和单位地址不一样,根据我们经验这不符合逻辑,通过知识图谱能把这种欺诈方式识别出来。
静态分析像我们第一个案例里面讲的结构。动态分析,通常情况下人的行为特征应该是稳定的,如果你短时间变化快的话,那我们认为你也有欺诈嫌疑。
以上是我分享的主要内容,谢谢大家。
张韶峰先生毕业于清华大学,拥有清华大学电气工程自动化学士、硕士学位。他有15年IT、大数据领域经验,持续创业者,先后效力Oracle、ESS、IBM等国际一流的科技公司。他曾经创办了专注于数据挖掘的公司天才博通,任执行副总裁;2009年与两位合伙人共同创办大数据技术与应用服务顶级公司百分点科技,目前该公司已占领国内超90%的推荐引擎市场。2014年,张韶峰先生创办专注服务于金融领域的大数据金融信息服务的公司百融金服,并担任CEO。
季元先生是清华大学数学系博士,从事银行风险管理近十年,谙熟金融风控量化管理、风险策略优化等业务,曾任中国光大银行金融市场风险处处长,在金融行业的数据分析、平台架构、模型研究和风险策略等方面具有深刻的理解和深入的研究。2017年加入百融金服担任CRO,全面负责百融金服整体风控业务。
清华-青岛数据科学研究院“技术•前沿”系列讲座,以知识传播为使命,分享大数据新技术与前沿挑战;旨在介绍大数据面临的新挑战及各种前沿技术,与校内科研队伍互动交流。
翊文化
当代是一个充满挑战的时代,一个充满机遇的时代。
金融科技正在和传统金融机构一起重新定义金融,这个过程必然伴随着现有金融机构的业务转型,这给从业人员带来了很大的挑战。
银行业这个传统的行业也不例外,以金融科技为核心的新型场域正在构建中,为银行业的变革注入新的想象力。
德意志银行首席执行官John Cryan 在法兰克福的会议上说道:在银行,我们有像机器人一样工作的员工;而到了明天,我们会有像人一样工作的机器人。我们是否参与这些变革并不重要,因为这即将发生。
近期,毕马威发布《中国银行业转型20大痛点问题与金融科技解决方案》报告,从银行业商业经营中所面对的20大行业共性痛点问题出发,总结了金融科技业态对这些痛点的创新应对思路与落地实施方案。
报告还指出,金融科技创新不会改变金融风险的实质。尽管银行业金融机构会因金融科技而产生变革,但所面临的金融风险并未改变,应该引起足够重视。
挑战与机遇
毕马威亚太区金融业主管合伙人李世民在报告中指出,伴随着中国经济和金融体制的发展和不断深化的改革升级, 中国的银行业格局发生了巨大变化,特别是在2007-2008年国际金融危机之后,在国内外各种因素的共同作用下,中国银行业在国际上的重要性和市场地位大幅度提升。
同时,在中国经济发展新常态的战略指导下,中国银行业又进入了新的发展历程。提升现代化企业治理水平、转变传统经营模式、打造差异化特色化发展策略、优化产品结构和提升资产质量等,都是发展新征程中所需要解决的关键问题。
基于对中国银行业的洞察和对未来发展的展望,毕马威认为中国银行业需要着力应对如下挑战:
利率市场化导致银行业竞争加剧、利润下降
同质化的低效竞争互换科技驱动的差异化
互联网催生了金融消费升级转型的新生一代
经济发展带来的人力成本上升需要高效技术的替代
经济环境的动荡和增长放缓互换提升内在价值的金融服务
针对中国银行业在这一过程中可能面对的挑战,毕马威中国金融业审计主管合伙人李淑贤指出,金融科技的发展带来了机遇。中国金融科技的爆炸式发展,对全球商业特别是中国金融业的发展和变革产生了重要影响,并成为中国诸多产业格局中越发引人注目的关键力量之一。通过利用金融科技产业理念,解决发展的痛点、成就客户价值,正在成为银行业发展转型的关键思路:
人类生产力的发展史就是技术应用的突破史
信息技术对产业效率的提升要求金融领域技术化
非科技支撑的金融创新可能导致剑走偏锋
很多领先科技的研发已经进入工业化应用的临界点
创新需要特殊的环境和组织模式,金融机构要在生态中与创新结合
流程与痛点解决方案
获客与营销——
1、获取高收益资产越来越难
利用线上电子商务与线下O2O,提供场景金融服务。
与领先金融科技机构合作开展在线信贷业务。
2、如何高效吸收低成本资金
以移动计算提供综合化、全景化的个人金融信息服务,低成本吸收资金。
为企业提供针对性的人力资源服务,实现企业员工的资金沉淀。
利用移动计算,提供个人信用管理服务。
3、如何高效开展金融产品的宣传与推广
通过社交媒体和大数据技术,低成本实现金融产品的宣传与推广。
基于智能的线上社会化营销,有效拓展金融产品的营销渠道。
4、个人客户精准低成本营销
通过大数据技术,对个人客户进行标签化刻画与精准分层。
通过个性化定价提供高阶形式的金融服务,精准定位个人客户。
5、小微企业客户获客与经营成本高
打造支付生态,以低费用、低门槛的便捷服务吸引小微企业客户。
通过电子商务的数据积累,驱动小微金融服务。
产品与服务——
6、实现小额高频的普惠信贷服务
移动计算与大数据征信的配合使用,助力信贷服务的普惠发展。
利用基于机器学习的信用风险量化模型,实现更高效的个人信贷服务。
基于区块链的智能合约,加强银行的信息流动和管理。
7、为大众提供高效低价的财富管理服务
基于移动计算技术,低成本提供财富管理服务。
打造智能投顾的业务模式,提供高效低价的投资与财富管理策略。
引入针对个人用户的智能投研,提高用户的维护与追踪效率。
8、繁琐的支付与转账服务
利用多种智能支付手段,提升个人消费者的交易效率和服务体验。
将区块技术用到跨境支付与结算领域,以降低交易时与费用。
9、个人金融服务的客服与消费者教育
通过智能聊天机器人,打造低成本、高效率、智能化的消费者教育渠道。
利用基于高速移动网络的移动客服技术,实现与消费者的实时互动交流。
10、农业金融的低效益与高风险
以物联网的综合应用,提供现代化的农业金融创新服务。
以大数据驱动的基于农业核心企业的农业产业链融资。
合规与风控——
11、个人金融服务中的反欺诈
利用网络大数据、设备指纹和机器学习模型,有效实现反欺诈。
通过交叉生物识别技术的应用,实现高效的反欺诈预防与管理。
12、针对中小企业信贷的传统风控手段乏力
通过大数据风险预警,实现企业信贷风险的识别、传导与跟踪。
以专业化移动贷后监控手段,掌握更加及时可靠的企业经营情况。
将区块链技术应用于企业征信,实现更加精准的信贷风险控制。
13、合规管理、反洗钱与客户评估
利用大数据分析与机器学习模型,有效识别可疑交易和风险主体。
利用区块链技术改善征信体系,及时发现欺诈、洗钱等违法行为。
利用智能化的监管规则专家系统进行合规管理。
运营管理——
14、运营有形网点成本高效益低
采用直销银行模式,减少或者消除线下有形网点的设立。
设立基于视频的虚拟网点,配合增强现实技术的面对面、场景化应用。
15、供应链金融中对信息流和物流的可靠追踪
利用科技和数据手段,进行基于物联网的物流和动产追踪。
基于区块链技术与大数据分析,实现供应链融资与信用沉淀。
16、机构结算与清算领域的流程、时滞及成本
通过区块链技术应用,提高供应链各参与方交易与结算效率。
通过分布式账本技术的应用,加快机构间清算与结算流程。
17、信贷业务流程的繁琐耗时
打造大数据平台,实现信贷流程的低成本管理。
结合供应链金融和电子商务,简化企业用户信贷申请流程。
18、海量业务资料的有效管理
利用自然语言处理技术,实现价值信息的高效提取、使用与复用。
基于知识图谱,构建用户知识网络和关系网络。
通过数据挖掘技术,实现海量业务资料的标签化管理。
科技基础与研发——
19、科技系统软硬件投资巨大且扩展性差
基于分布式计算及云计算,部署或迁移银行科技系统。
引入互联网产业的敏捷开发体系,加快对需求的反应速度。
20、科技研发与创新效率低
对金融科技企业开展投贷联动与业务合作。
联合投资机构设立金融科技产业联合投资基金。
开展推动银行内外部科技研发的创新大赛。
风控为本,不忘初心
报告指出,金融科技创新不会改变金融风险的实质。尽管银行业金融机构会因金融科技而产生变革,但所面临的金融风险并未改变。而且,在新的技术环境下,这些风险可能以更具隐蔽性、波动性和挑战性的形式展现。因此,商业银行需要充分利用金融科技的支持,培养识别风险的洞察力,打造更为智能化的、量化的、主动型的风险管理能力,实现健康与可持续发展。
报告从如下几个领域,分析金融科技创新环境下风险演化的特征,探讨风控工具的特点:
信用风险:金融科技企业在增加金融服务可获得性的同时,有可能降低客户门槛,引入更多的高风险客户群体。普惠金融的信用风险管理应以量化管控为主,鉴于目前中国个人征信基础设施尚不完善,利用网络大数据提升信用风险评估水平是一条创新途径,而且即便是小额分散,也要精准计量信用风险量化迁徙的内在趋势,不能忽视资产组合的整体风险。
市场及流动性风险:在金融服务领域,便捷的服务提升金融服务的价值,同时也加剧了产品和服务交付的频率,进而提升了终端供需向金融市场反馈的速度, 具体体现为资金资产流动性和市场价格风险的波动。波动既是资源配置活跃性的反映,更是风险管理领域的挑战,各类涉足金融的机构都要对此有深刻的认识和积极的应对。好消息是,通过与大数据和机器学习相关的智能风控技术,金融科技创新提供了更好的识别、计量和管控相关风险的手段和工具。
操作/科技风险-网络与信息安全风险:领先信息科技的应用是金融科技生态中的普遍现象,特别是全面的网络化、自动化和数据化,越来越多的采用外包服务与数据对接,会给金融机构的网络安全管理带来重大挑战,客户数据泄露的情况也时有发生。因此,金融科技企业需要建立一整套覆盖数据采集、处理、传输、分发、清理和销毁在内的完整的数据安全管理机制。
操作/科技风险-欺诈风险:当创新业务引入越来越多技术要素时,操作风险管理将更多关注技术流程所引入的风险点。领先技术的应用既带来了便捷也带来了更多挑战,由于应用历史有限,需要金融科技企业认真面对其稳定性与可靠性。在诸多普惠金融领域,利用专业技术手段开展反欺诈是其商业模式成功的重要基础,特别是当业务大规模迁徙到线上以后,培养基于数据和智能技术的反欺诈能力是金融科技企业的核心竞争力。
法律合规风险:由于金融业风险存在重大性、滞后性和隐蔽性等特征,金融科技企业需要严肃面对包括合规风险在内的各项挑战。互联网领域强调的“试错性创新” 需要和监管沙盒体制有机结合,并及时总结技术创新应用领域的经验与教训,才能从根本上避免盲目经营陷入误区,防范整个行业“监管博弈”所带来的体系性风险。
客户适当性/声誉风险:不论是投资还是借贷,产品的购买与交付都是严肃的金融行为,金融机构应当将金融产品销售给适当的客户,而并非盲目推销,要充分提示客户金融消费的风险和责任,否则在客户接纳阶段犯下的错误,迟早会以各种形式反作用与于金融机构,对企业声誉造成重大影响。以资产管理业务为例,对投资者进行充分的风险提示和教育,做好及时的信息披露,打消投资者对非保本产品的刚兑预期,不仅有利于减少金融机构外部压力, 也是整个资产管理行业发展的方向。在这个领域,智能化的客户识别、评估与沟通工具等领先科技将会有普遍的应用。
(本文根据毕马威报告编辑,版权属于毕马威所有。编辑时有删节。)
翊文化
大数据、人工智能、区块链、云计算、物联网、移动支付等新兴技术蓬勃发展并不断加速向社会生活的各领域渗透融合,对经济发展和社会进步产生了深刻影响,金融业的产品服务、运营管理和客户体验也在技术的驱动下加速了创新变革的步伐。
大数据是重要的生产资料,是人工智能大脑流动的血液,作为国家“互联网+”行动的重要战略资源,对金融机构智能转型化发展的驱动作用越发凸显,成为构建银行未来核心竞争力的关键。
驱动银行业数字化转型
目前,良好的政策环境也推动中国大数据产业快速发展。为了鼓励包括大数据在内的新兴技术发展,中国监管机构与时俱进地制定和出台了系列政策,有力地保障和促进了行业的整体稳健发展。《国务院关于积极推进“互联网+”行动的指导意见》明确要求鼓励金融机构使用互联网拓宽服务覆盖面,使用云计算、移动互联网、大数据等技术手段来加快金融产品和服务创新,在更广泛地区提供便利的存贷款、支付结算、信用中介平台等金融服务。《中国银行(4.070, 0.01, 0.25%)业信息科技“十三五”发展规划监管指导意见(征求意见稿)》也明确要求要构建数据共享机制,逐步实现内外部数据的融合;统筹规划大数据基础设施,推进大数据平台建设;建立大数据服务体系,扩大数据服务的用户覆盖面;积极扩大信息来源以奠定大数据应用基础;开展大数据营销,提高获客能力和客户黏性;加强大数据风控,全面了解运营情况并及时优化业务流程,以推动业务创新;拓宽普惠金融的服务范围为实体经济发展提供支撑。
大数据、人工智能等技术的发展正处于由量变到质变,从概念到应用的阶段,在新一轮技术革命、产业升级和经济转型的历史交会点上,抓住了就是机遇,错过了就是挑战。一个银行能否百年长青,核心在于理解和拥抱新技术,以创新推动转型发展。大数据作为银行业的核心资产,“用数据驱动转型发展”已经成为大家的共识。商业银行拥有大量的金融交易数据,具备成为数字化转型的先天优势。过去海量的结构化数据相互割裂、静止,沉睡在数据库中。随着新技术的快速进步,金融行业的数据应用开始流动融合,变得活跃而有生命力。大数据已经成为银行业创新的一把利器,具备大数据驾驭能力的金融机构可以实现基于数据驱动的管理决策、服务运营、风险管理及产品创新等的智能化转型与变革。
同时,对于占国家金融命脉主体地位的商业银行,以至于整个金融体系而言,大数据可以解决部分黑色产业漏洞及安全威胁。互联网金融蓬勃发展的同时也面临着更加严峻的安全考验。首先,传统黑客变种升级,钓鱼网站、木马僵尸、撞库攻击、安全漏洞等越发肆虐,黑产技术的先进性、复杂性、隐蔽性和持续性都远远超出了传统网络安全技术的应对与防护能力范围,不断侵蚀金融生态安全,犹如溃堤的蚁穴,若无数个不受控制的单个风险点最终全面开花将会带来巨大的损失。其次,新技术、新架构的应用引入新的安全风险与威胁。再次,互联网环境下的信息泄漏和信息滥用等问题越发严峻,银行业如何在开放合作中有效保护客户隐私与信息安全任重道远。所谓道魔互博,借助大数据技术可以解决创新阶段的黑产漏洞及安全威胁带来的制约。比如基于海量的计算和存储能力打破信息孤岛,持续丰富信息数据维度,完善治理数据质量的同时可实现威胁情报与信息共享。再比如,借助大数据技术并结合机器学习及人工智能,可以有效加强网络安全威胁的态势感知、预警与分析,提升金融网络安全防御的广度与深度,前瞻性地了解对手,提前感知并精准定位风险,并采取有效的风险应对措施为业务的稳健发展和银行的智能转型保驾护航。
传统商业银行的挑战
传统商业银行是最先使用信息技术也是信息技术使用最广泛的行业之一。银行对客户、账户信息的存储和使用都有健全的管理机制。但是与新兴的互联网企业相比,由于起点不同,银行的数据管理能力存在明显差距,银行业整体在大数据使用方面也面临挑战。
首先,银行在内部数据收集方面遇到的挑战。银行在数据应用方面的挑战是全方位的,传统的IOE架构因为存储成本相对较高,大量的历史数据存储在磁带中,甚至档案馆中还有大量没有数字化的物理凭证或没有结构化的影像数据。即使将这些数据结构化,银行还要面临历史数据标准不统一、缺乏有效数据治理手段、数据质量参差不齐、数据应用无章可循等历史遗留问题。与此同时,传统的以账户为中心,以会计为导向的银行IT系统缺乏收集客户账户查询、咨询、投诉等行为信息的能力,无法体现高维度的数据价值。数字时代银行的IT系统必须是以客户为中心,以市场为导向,具备采集全渠道客户基本信息、交易信息、交易对手信息、客户与银行的接触轨迹信息等更多维度信息的能力。这就要求银行从客户信息治理、丰富客户模型开始,不断完善客户、账户信息的同时开始客户行为信息的收集。数据的价值将会随着维度的增加而显著提高。
其次,银行在外部数据收集方面遇到的挑战。互联网平台公司拥有大量与客户频繁互动的场景,在收集客户行为信息、客户之间关联信息等方面具有天然优势。银行必须通过与互联网企业合作才能采集更多维度的信息,但是银行必须在保护客户隐私的合规前提下,及时有效地获取相关信息。其合规成本与合作的代价也是传统银行在开发相关数据应用时必须考虑的。
再次,银行在大数据应用IT支撑方面遇到的挑战。大数据应用的软硬件支撑平台对传统银行的IT系统提出了新的要求。特别是在分布式存储和处理实时数据能力方面银行迫切需要专业的人才支持。非结构化数据的结构化,具备自学习能力的数据模型机制,还要求银行具备将前沿的人工智能技术与大数据应用相结合的能力。此外,商业银行还需要在实践中培养可以支持开放式平台架构、分布式应用系统、Hadoop架构等的开发和运营维护人员。
大数据金融的探索与展望
在外部技术变革驱动和内部转型发展的共同推动下,中国银行业都在积极地践行国家“互联网+”战略,前瞻性地探索并积极推进新兴技术的应用,将科技创新与业务创新深度融合。国内多家银行目前已经在精准营销、智能风控、跨界合作、普惠金融、数据治理等方面取得了显著的应用成效,有效地提升了自身网络金融包括风险管理、大数据应用、人工智能应用、云计算、产品效率等核心能力。结合中国银行的实践经验而谈,对于银行业而言大数据金融的探索与实践,需要提升以下四个的方面的能力与效率。
一是大数据洞察,建立客户全生命周期管理。过去银行对客户的了解主要依赖于开户基本信息和账户交易情况,对客户行为、偏好、动态知之甚少,无法满足不同客户千变万化的需求。并且,在中国的信用体系还不完备的情况下,很大一部分长尾客户是“信用白户”,当前校园贷市场的乱象和正规金融机构的缺位也有直接的关联。针对这些问题,多家银行尝试利用大数据对客户进行全面画像,在洞察客户多元化需求的基础上提供个性化服务和差异化定价,同时精准识别潜在客户,激活睡眠客户的同时,提升客户满意度。以中国银行为例,一方面以“+互联网”的模式推动传统银行业务触网,另一方面以“互联网+”创新服务,基于大数据技术识别客户的贷款意愿、评估还款能力,推出了全流程在线信用贷款的秒贷产品。同时,把目光放至客户的全生命周期信用管理,用大数据技术“提前锁定”潜力客户,动态更新信用评分,了解客户动向,测算包括校园贷、助学贷在内的金融产品的未来盈利能力。也正是基于整合分析了海量金融数据,精准描绘客户画像,预测客户的成长属性,秒速实现从申请、审批到放款的业务流程全在线,中国银行可以在大数据技术的帮助下,积极践行国家普惠金融战略。而发展普惠金融是金融支持实体经济的必然要求,也是银行业转型的重大机遇。普惠金融的核心理念是“金融普惠”,解决普惠金融发展特别是信贷业务的痛点,需要解决效率、成本、体验、风控等四个方面的核心问题。大数据提供了解决之道。利用大数据能够在一定程度上提升风控能力,提高业务处理速度,降低边际成本。
二是大数据风控,助力银行智能化转型。商业银行的经营管理和风险管理面临诸多前所未有的挑战,传统信贷投放中,客户经理一般用财务报表、人行征信、抵质押品等基本信息,依靠经验进行信用评估。传统的视图反映了客户当前静止的、切片式的状态,受限于能力和信息的不对称,就算“握着客户的手放款”也未必能真实了解客户的实际风险承受能力并做出预判,从而导致银行遭受风险损失。而基于大数据技术的风控平台打通了行内行外数据孤岛,若更加充分利用政府平台公开信息以及互联网信息,结合人工智能建模技术在海量信息中进行价值挖掘,商业银行大数据应用将全面嵌入业务流程,提高风险精细化管理水平的同时也能有效地提升风险决策的实时性。比如利用知识图谱挖掘技术挖掘集团间、企业间、主要控制人间隐藏关联关系,并生成可视化关联关系图谱,及时发现异常避免不必要的风险损失。大数据应用使得金融机构以动态的、联系的、全面的、发展的视角描绘客户成为可能,传统风控的理念是根据历史预测未来,而现在的技术手段让我们在风控上不仅可以“以史为鉴”,更可以“继往开来”。
三是大数据合作,跨界打造金融数据生态圈。互联网企业加入到以往只有传统金融机构的市场竞争中,对产品服务、盈利模式和客户体验进行了颠覆,传统行业都不同程度受到冲击,在经济新常态下传统企业更要抱团取暖,形成合力。而大数据的价值在于准确、及时地整合和应用行业内外的有效数据,把跨业、跨界多维度的数据集聚起来,发挥传统行业各自领域所长,打造数据生态圈。因此商业银行需要建立合作思维,以合作的心态与能为自身提升金融效率、降低风险的大数据机构进行跨界合作,实现共赢。
四是强化安全管控,建立健全客户信息安全机制。大数据的发展是把双刃剑,大数据在不断发展的过程之中,买卖数据和信息泄露等威胁个人信息安全并侵犯个人合法权益的不法事件频出。2017年6月1日《中华人民共和国网络安全法》正式实施,加强了对个人信息的保护。中国银行业应严格遵循相关法律法规要求,持续强化基础设施的安全保障与防护体系,持续强化数据安全治理,持续强化数据流动与利用管理机制。
为充分发挥大数据潜力以驱动网络金融业务发展,中国银行业需构建政产学研用为一体的开放、共享、互利、共赢的大数据产业生态体系。在数据共享方面,应加强顶层设计和统筹协调,推动资源整合和公共数据互联开放共享,借力“一带一路”倡议契机推动全球范围内的全息数据共享。在数据安全方面,应不断完善法规制度和标准体系,切实保障数据安全。在数据质量方面,高质量的数据是大数据发挥效能的“生命线”,应采取系统性方法进行全生命流程的数据质量管理,从数据源头出发改善数据质量并提供持续迭代的资源投入。在人才队伍方面,应着力培育具备业务视角与技术敏锐度的跨界复合型人才,为建立大数据分析导向的智能化应用和全生命周期链路持续提供输入。在创新研究方面,应聚焦大数据创新前沿,加强前瞻性研究的同时利用柔性团队迭代开发快速孵化新应用。
可以预期,未来将有越来越多的商业银行用数据驱动银行智能转型发展,打造有温度的普惠金融产品,培育健康向上的金融生态,为实体经济服务,为普罗大众服务。(作者系中国银行总行网络金融部总经理、中国互联网金融协会金融科技发展与研究工作组副组长。
来源:《清华金融评论》
延展阅读:区块链将重塑金融服务
当人们听到分布式账本技术(DLT)或者区域链时,通常想到的是「比特币」,但这只是这一概念其中的一部分。
我们的研究发现,DLT 是一种可将金融服务基础设施转变的技术,其提供了重塑行业构架,重建金融流程,从而使其更简化、高效和焕然一新的机会。
DLT 还对目前的商业模式基于的假设提出挑战。对内部 / 外部对账、流动性管理及合规性等流程提出了疑问。DLT 这一有效且经济的应用需要现有企业、创新企业及监管机构之间的深度合作,因此其落地实施可能还需要一段时间。
我们还发现,尽管 DLT 具有令人期待的前景,但并非万能药。其仅仅是众多工具,如认知运算、机器人学、云及高级分析工具中的一种。这些工具将共同塑造未来金融服务设施的基础。
哪些业务流程将会由 DLT 提供支持,以怎样的形式提供支持?我们现在还不得而知,因为这取决于具体的业务需要。
但是我们可以大胆推测。我们认为 DLT 将可能有助于改进付款、保险、存款、借贷、资金筹集、投资管理及市场供应等诸多流程,甚至将有助于突破某些流程的现有局限,扩展现有流程的服务性能。
可以看到,三年内在 DLT 领域共有超过 2,500 项专利申请及逾 14 亿美元投资。全球至少有 24 个国家对其进行投资、50 家公司加入与之相关的联盟,90 家银行参与到与之相关的讨论。有人预测,到明年将有 80% 的银行会就 DLT 立项。
DLT 已经牢牢吸引了金融行业的注意力及资金。
但 DLT 的开发运用同时也存在障碍,例如,监管环境存在不确定性、相关标准的制定仍在起步阶段,目前仍缺乏正式的法律框架等。所有这些因素都在阻碍 DLT 的大规模运用实施。
同时,DLT 也面临所有技术变革都会遇到的常规挑战。通过 DLT 更新金融基础设施耗时很长且投资金额巨大。此外,利益竞争将使得合作行为转变成一种谨慎的利益平衡。
那 DLT 到底是什么,使其虽有如上缺陷但仍具有非凡的吸引力?简单来说,它是一种去除中介机构而通过计算机网络以可靠的方式在交易双方间转移资产的技术。交易以时间块的形式被记录在一个公共且防干扰的数据库内。资产由代币代表。所有交易方均可以进入数据库。数据库具有透明化,记录不可更改的特点,且能够自动执行业务规则,从而实现卓越的自动化功能。
DLT 对金融服务带来的影响重大。交易速度变快,但成本会更低。信息孤岛也会消失。随着信用历史及资产来源成为记录的不可变部分,风险也随之相应地减少。视界会拓宽:例如,更容易确认交易伙伴是否兑现在谈判中做出的承。
由于随时可获得审计跟踪记录,所以争议处理的过程会更简单。智能合约可实时执行具有约束力的协定。
如果使用新的基础设施,企业和监管机构能够更融洽的相处,前提条件是 DLT 能使合规性要求更容易被执行。一个可能的方式是:监管机构最终可进入共享数据库并获得其所需数据。
与此同时,价值定位发生变化。金融机构能够彼此核对记录并解决争议,从而促使中介机构重新考虑自己的业务模式。
贷款人能更好的了解借款人所抵押的资产,有助于做出更好的信贷裁定及定价决定。几乎没有企业可以依赖信息不对称来获得竞争优势。
然而,在这些实现之前还有很多工作要做。企业必须坚持成本效益分析、制定执行路线及治理模式。行业及政府须制定明确的具监管、法律及管辖权一体的纳税指南。在目前的状况下,要挑出 DLT 开发的优胜方和失败方还为时过早。
即便如此,我们仍可讨论潜在的运用案例。事实上,构建假设情景将有助于理解通过 DLT 转变金融服务结构的可能性及实际情况。在一切都未知的情况下,潜在的运用案例亦可帮助我们做出部分假设,例如:
• DLT带来的其他新兴功能(如数字身份)。
• 分布式账簿解决方案具有扩展能力(在某些情况下可处理数十亿交易)。
• 分布式账簿中记录的具有自动执行行为功能的数据源不会受到损害。
• DLT的效益取决于实施方式及司法管辖。
六大结论
1、实现精简及高效。
通过新的基础设施及流程,DLT 可以帮助精简金融服务行业流程。这将释放原先耗费在核对和争议解决中的大量劳力,也将去除在清算和交易结算时对第三方的依赖。而且,DLT 可实现监管者对受监管实体金融活动的实时监控。
当然,DLT 带来的潜在效率提升远不止体现在常规流程操作中。利用 DLT,交易各方可在共享、安全的环境中编制及
签订协议,从而降低违约的风险。DLT 还可减少资本占用。此外,DLT 还可实现资产来源、交易历史及资产流动性来源的透明化。
2、DLT 是重制金融服务基础设施的其中一项技术。
技术创新在过去50年不断改变着金融服务的基础。半导体微处理器使电子数据替代了手工记录,开启了信用卡的时代。
终端及 PC 促进了 ATM 的开发。局域网实现了电子交易,而互联网则实现了电子银行。近年,则涌现了如智能设备这样的创新带来了移动支付的产生。
如今,金融服务可能发生再一次的变革—但这一次,变革将源于各项新兴技术的共同作用,包括生物统计学、机器人
学及机器学习。云、认知学及量子运算也在其中。金融行业将利用这些技术以及 DLT 构建下一代基础设施。
3、DLT 的好处取决于解决什么样的业务问题。
不同的案例运用技术的方式是不同的。例如在贸易金融中,DLT 可以加速结算,也能允许交易各方实时跟踪及管理信用证。
合规方面,DLT 的自动化及数据不可变更的特点将提供更快捷和更准确的报告。全球支付方面,DLT 可避免金融机构之间转账时产生的摩擦和延迟。
另一个案例是资产再抵押,DLT 可通过向市场参与者提供再抵押资产的更详尽信息使其做出更为知情的决定。
4、数字身份、数字许可及其他新功能可提升 DLT 的吸引力。
如果 DLT 仍依赖传统物理协议确认身份,则无法最大可能的体现其益处。而数字身份系统则可与基于 DLT 的基础设施融合,无缝确认客户及交易对手的身份,也可以促进更快、更准确的完成反洗钱(AML)及「了解客户」(KYC)程序。
类似地,尽管 DLT 系统可能拥有自身的计值代币,但部分用户需要系统资产与法定货币之间存在高流动性。为满足这一需要,各中央银行可在分布式金融基础设施中发行法定货币,从而保证流动性,同时消除新基础设施与现金之间的低效连接。
那其他创新技术的现状如何呢?未来,我们可能看到分布式金融基础设施与人工智能或物联网的结合。此类技术以如此快的速度在发展,我们目前只能大胆猜测它们的潜在益处。
5、DLT 中最重要的应用需要大量行业合作。正式推出之前可能需要很长时间且过程也更为复杂。
用 DLT 替代现有金融基础设施是一项巨大且花费昂贵的工程。现有企业、创新企业及监管机构需要整合各自利益,共
同合作,从而实现行业的标准化。这将延迟 DLT 在监管力度较大的市场内大范围实施的进度。但通过行业标准化的实现,我们最终可以获得一个得到法律及管制支持、更为现代化的可扩展金融基础设施。
6、DLT 将颠覆当今的业务模式。
DLT 将不可避免的改变支撑当今金融服务的假设。例如,关于冗繁信息核对流程的假设,DLT 的分布式基础设施和信息的不可更改性将消除信息孤岛,使得交易各方拥有同一套历史数据,从而无需再执行繁重的信息核对工作。
现今,我们仍然需要一个中央的权威机构在市场参与者之间进行调解,但分布式基础设施带来的透明性免除了中介的必要性,同时也减轻了法律合规及监管的负担。
最后,由于目前的合同执行假设交易各方都不可信赖,所以权威的第三方必须参与合同的执行。分布式金融基础设施拥有的自动执行特性将使信赖变得无关紧要。交易各方可确保根据事先约定执行相应条款而避免第三方的干预。
(本文摘编自德勤公司发布的公开报告,版权归德勤公司所有,如需阅读全文,请登录德勤公司官方网站。)
新一代技术+商业操作系统:
AI-CPS OS
在新一代技术+商业操作系统(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能)分支用来的今天,企业领导者必须了解如何将“技术”全面渗入整个公司、产品等“商业”场景中,利用AI-CPS OS形成数字化+智能化力量,实现行业的重新布局、企业的重新构建和自我的焕然新生。
AI-CPS OS的真正价值并不来自构成技术或功能,而是要以一种传递独特竞争优势的方式将自动化+信息化、智造+产品+服务和数据+分析一体化,这种整合方式能够释放新的业务和运营模式。如果不能实现跨功能的更大规模融合,没有颠覆现状的意愿,这些将不可能实现。
领导者无法依靠某种单一战略方法来应对多维度的数字化变革。面对新一代技术+商业操作系统AI-CPS OS颠覆性的数字化+智能化力量,领导者必须在行业、企业与个人这三个层面都保持领先地位:
重新行业布局:你的世界观要怎样改变才算足够?你必须对行业典范进行怎样的反思?
重新构建企业:你的企业需要做出什么样的变化?你准备如何重新定义你的公司?
重新打造自己:你需要成为怎样的人?要重塑自己并在数字化+智能化时代保有领先地位,你必须如何去做?
AI-CPS OS是数字化智能化创新平台,设计思路是将大数据、物联网、区块链和人工智能等无缝整合在云端,可以帮助企业将创新成果融入自身业务体系,实现各个前沿技术在云端的优势协同。AI-CPS OS形成的数字化+智能化力量与行业、企业及个人三个层面的交叉,形成了领导力模式,使数字化融入到领导者所在企业与领导方式的核心位置:
精细:这种力量能够使人在更加真实、细致的层面观察与感知现实世界和数字化世界正在发生的一切,进而理解和更加精细地进行产品个性化控制、微观业务场景事件和结果控制。
智能:模型随着时间(数据)的变化而变化,整个系统就具备了智能(自学习)的能力。
高效:企业需要建立实时或者准实时的数据采集传输、模型预测和响应决策能力,这样智能就从批量性、阶段性的行为变成一个可以实时触达的行为。
不确定性:数字化变更颠覆和改变了领导者曾经仰仗的思维方式、结构和实践经验,其结果就是形成了复合不确定性这种颠覆性力量。主要的不确定性蕴含于三个领域:技术、文化、制度。
边界模糊:数字世界与现实世界的不断融合成CPS不仅让人们所知行业的核心产品、经济学定理和可能性都产生了变化,还模糊了不同行业间的界限。这种效应正在向生态系统、企业、客户、产品快速蔓延。
AI-CPS OS形成的数字化+智能化力量通过三个方式激发经济增长:
创造虚拟劳动力,承担需要适应性和敏捷性的复杂任务,即“智能自动化”,以区别于传统的自动化解决方案;
对现有劳动力和实物资产进行有利的补充和提升,提高资本效率;
人工智能的普及,将推动多行业的相关创新,开辟崭新的经济增长空间。
给决策制定者和商业领袖的建议:
超越自动化,开启新创新模式:利用具有自主学习和自我控制能力的动态机器智能,为企业创造新商机;
迎接新一代信息技术,迎接人工智能:无缝整合人类智慧与机器智能,重新
评估未来的知识和技能类型;
制定道德规范:切实为人工智能生态系统制定道德准则,并在智能机器的开
发过程中确定更加明晰的标准和最佳实践;
重视再分配效应:对人工智能可能带来的冲击做好准备,制定战略帮助面临
较高失业风险的人群;
开发数字化+智能化企业所需新能力:员工团队需要积极掌握判断、沟通及想象力和创造力等人类所特有的重要能力。对于中国企业来说,创造兼具包容性和多样性的文化也非常重要。
子曰:“君子和而不同,小人同而不和。” 《论语·子路》云计算、大数据、物联网、区块链和 人工智能,像君子一般融合,一起体现科技就是生产力。
如果说上一次哥伦布地理大发现,拓展的是人类的物理空间。那么这一次地理大发现,拓展的就是人们的数字空间。在数学空间,建立新的商业文明,从而发现新的创富模式,为人类社会带来新的财富空间。云计算,大数据、物联网和区块链,是进入这个数字空间的船,而人工智能就是那船上的帆,哥伦布之帆!
新一代技术+商业操作系统AI-CPS OS作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎。重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式。引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。
产业智能官 AI-CPS
用“新一代技术+商业操作系统”(AI-CPS OS:云计算+大数据+物联网+区块链+人工智能),在场景中构建状态感知-实时分析-自主决策-精准执行-学习提升的认知计算和机器智能;实现产业转型升级、DT驱动业务、价值创新创造的产业互联生态链。
长按上方二维码关注微信公众号: AI-CPS,更多信息回复:
新技术:“云计算”、“大数据”、“物联网”、“区块链”、“人工智能”;新产业:“智能制造”、“智能驾驶”、“智能金融”、“智能城市”、“智能零售”;新模式:“案例分析”、“研究报告”、“商业模式”、“供应链金融”、“财富空间”。
本文系“产业智能官”(公众号ID:AI-CPS)收集整理,转载请注明出处!
版权声明:由产业智能官(公众号ID:AI-CPS)推荐的文章,除非确实无法确认,我们都会注明作者和来源。部分文章推送时未能与原作者取得联系。若涉及版权问题,烦请原作者联系我们,与您共同协商解决。联系、投稿邮箱:erp_vip@hotmail.com