数据玩家作品,转载要求见文末
学者简介
范剑青:复旦大学大数据学院院长、美国普林斯顿大学终身教授、台湾中研院院士,曾获2000年度国际统计学领域最高奖COPSS总统奖。
7月6日下午,范剑青在2017上海静安国际大数据论坛--大数据与金融创新分论坛上,从大数据与小微金融的视角做了主旨演讲。下文由数据玩家整理自范剑青本次演讲,略有删减。(本文内容未经演讲者本人确认,仅供学习参考)
>>>> 数据海啸席卷全球
大数据伴随着技术与信息的革命应运而生,发展迅速。
-上千万的摄像头,数亿部的智能电话,几十亿次的网页搜索和社交网络上的对话产生了巨大的数据,其中包括公共安全、公共卫生、商业活动、经济走势等信息。
-数十亿的处方、海量的生物、遗传信息带来健康医疗大数据。
-无数次的科学实验和观察产生从天文到地理、从物理到化学的科学大数据。
海量数据的收集促进了大数据时代的到来。
>>>> 数据变革无处不在
大量的数据被常规性的收集
-生物科学:基因组学、遗传学、神经学、医学
-自然科学:天文学、地球科学、气象学
-工程学:机器学习、监控视频、社交媒体、网络
-社会科学:经济学、金融学、市场营销、管理学
>>>> 从样本到全体、从量变到质变
它给数据存储、传输、分析带来了诸多新的挑战
它彻底改变了计算机科学、统计学和计算数学许多方面
-从硬件到软件
-从存储到超算
-从网络传输到并行计算
-从数据分析到统计建模
······
>>>> 数据科学:从单一学科到整合科学
>>>> 大数据分析的核心任务:大数据——智慧数据
>>>> 大数据的出现
-为健康医疗、科学发现、技术创新、商业管理、政府决策等带来了信息海啸驱动的又一次工业革命。
-同时也在方方面面改变着人类的工作、生活和通讯方式。
-各行各业技术创新所产生的大量数据增加了对海量数据处理和分析的强烈需求。
>>>> 传统金融业在大数据时代面临的机遇与挑战
>>>> 大数据与金融
机器智能在程序化金融市场业务中优势凸显、降低金融行业劳动力技术
-商业银行:消费金融、财务分析、客户管理、风险甄别
-证券市场:量化交易、投资顾问、风险防范、信用评估
-保险行业:信用管理、欺诈分析、获客分析
-政府职能:系统风险评判、入市\退市智能系统
>>>> 科技创新开拓展了金融服务对象
>>>> 数据驱动下的金融业创新模式
>>>> 小微金融概览
小微金融是指专门向小型和微型企业以及中低收入人群提供的小额度的一大类金融产品和服务的总称,包括但不限于存款、贷款、资金转账、保险等。
——亚洲开发银行,2000
>>>> 基于大数据的小微金融产品定价
-合理的定价是任何金融产品可以执行和持续的基础。
-一个负责任的小微金融产品必须考虑到机构和金融服务的可持续性。
-基于大数据的信用评估被实践证明是一个能够提供更快更有效信用决策的有效工具。
>>>> 小微金融产品定价的基准及其综合定价方法
小微金融产品定价的基准
基于成本-价格等于成本加上差额(margin)
基于市场和竞争-价格根据竞争对手的价格来确定
基于需求或价值-小微金融服务提供机构有一套评价其产品对用户的价值的体系,价格由改评价体系来决定。
将以上三种定价基准综合起来可得到一个新的小微产品定价方式
首先,确定提供该产品\服务所需要的全部成本价格。
其次,将该价格与竞争对手的报价相比,看是否有提升空间。
最后,使用价值评估系统来评估产品的独特性的需求,来看是否价格有更多的提升空间。
>>>> 中国的小微金融发展情况
-中国小微金融实践的第一次试验出现在上世纪九十年代中期。
-然而,中国小微金融的发展相当缓慢,目前,其在金融市场的影响仍然相当微弱。亚洲开发银行2004年报告就指出,中国小微金融发展缓慢的原因,包括人力资源不足、资本匮乏以及知识储备不足。但最主要的约束条件是缺乏完备的法律与监管环境。
-中国关于小微金融政策和监管框架还在形成中。事实上,小微金融一直被视为非正规金融,监管部门因担心其导致金融风险而加以限制。
>>>> 当前小微金融结构与发展潜力
目前,国内提供小微金融服务的机构主要有:
-注册的小额贷款公司
-乡镇银行\农村信用合作社
-NGO
-部分城商行(北包商、南泰隆)
-网络平台(P2P、互联网保险、网络小额借贷等)
鉴于中国银行业面临的监管约束以及中国庞大的中低收入人群与小微企业群体,小微金融在中国有非常大的发展空间。
>>>> 互联网金融的发展与现状
>>>> 中国P2P市场的总体情况及存在的问题
>>>> 中国小微金融发展的挑战
>>>> 基于大数据的小微企业信用评估体系
阿里巴巴的芝麻信用评估模型利用了集团内部超过100个数据库:
-利润增长数据
-交易数据
-客户在其所在行业地位/评价数据
-行业内地位变化数据
-消费者评分与购买数据
-淘宝上的不良行为与惩罚记录
······
>>>> 对统计学方面的挑战
>>>> 对计算数学方面的挑战
计算上的瓶颈-对大数据的处理所需要的计算能力远非传统计算机所能胜任。需要在优化、计算和统计领域提出新的思想和方法。
数据加密-数据经过压缩和加密以后,难以重复获取原始数据来修正已有的统计量。
与数据流类似。
>>>> 对大数据系统的挑战
存储和传输:需要搬得动!
新设想:分布式处理网络
需要分布式数据的原因:
-规模:难以在单个机器上存储和处理
-传输成本:昂贵(如高维数据的海森矩阵)
-隐私:数据传输易引发隐私泄露与主权丧失
-安全性:降低数据丢失的风险
>>>> 结束语
数据科学是大数据系统与计算和大数据统计与分析的有机结合,能够促进新技术开发、新产品研制,并最终服务社会。大数据已引起了美中日欧盟等多国家和地区的重视。发展大数据产业,人才培养是关键。
关于转载
如需转载,请在开篇显著位置注明作者和出处(转自:数据玩家 | fbigdata),并在文章结尾放置数据玩家醒目二维码。未经许可的转载以及改编者,我们将依法追究其法律责任。
限时干货下载:添加微信公众号“数据玩家「fbigdata」”
回复【2】免费获取「完整数据分析资料,包括SPSS\SAS\SQL\EXCEL\Project!」