课程简介:
在信贷风控领域,随着大数据、计算机集群技术、网络技术和人工智能的发展,越来越多的金融机构将传统的策略风控手段转向依赖机器学习模型等量化手段。信贷环节中的审批、预警、催收以及营销等诸多场景也适合机器学习模型的应用。机器学习模型的发展离不开数学、统计、概率、计算机理论等基础知识。本课程将从较为基础的统计和概率入手,展现如何从从基础知识入门进而掌握较为先进的机器学习模型,从而构建简单但实用的风控模型。
此外,编程能力也是风控模型搭建中必不可少的能力。本系列课程将实用功能强大、入门简单的Python语言。在Python中既有丰富的开源包可以使用,也可以定制化地开发有针对性的模块来构建风控模型。
课程大纲:
第一课:初等概率论
1) 离散随机变量与离散分布
2) 连续随机变量与连续分布
3) 条件概率与贝叶斯公式
4) 马尔科夫矩阵
5) 案例:信贷违约的转移矩阵
第二课:初等统计理论
1) 假设检验
2) 参数估计
3) 线性回归
4) 案例:性别对信贷违约的影响
第三课:数据分析师的养成计划
1) 业务背景
2) 数据搜集与整理
3) 数据可视化与数据报表
4) 案例:信贷违约预测中的数据可视化
第四课:python的介绍和入门
1) python语法
2) pandas,numpy,statsmodels,sklearn等常用包
3) 案例:pandas中的数据切片
第五课:时间序列模型的应用
1) AR模型
2) MA模型
3) ARIMA模型
4) 其他常见的时间序列模型
5) 案例:从股票收益率的预测说起
第六课:广义线性回归
1) 泊松回归
2) 逻辑回归
3) 案例:预测违约发生事件数
第七课:分类场景之决策树与随机森林
1) 分类树的基本概念
2) 如何控制模型过拟合
3) 回归树的基本概念
4) 随机森林
5) 案例:信用卡的欺诈识别
第八课:分类场景之支持向量机
1) 从线性可分说起
2) 对偶问题
3) 巧妙的核函数
4) 软间隔:妥协的艺术
5) SMO算法详解
6) 案例:信用卡的欺诈识别
第九课:聚类场景之K均值聚类与K邻近聚类
1) K均值聚类:物以类聚、人以群分
2) K邻近聚类:近朱者赤、近墨者黑
3) 案例:信贷客群的聚类分析
第十课:一统江湖之神经网络模型与深度学习模型
1) 神经网络模型的基本框架
2) 反向传播算法
3) 深度学习模型
4) TensorFlow的使用
5) 案例:信用卡的欺诈识别
第十一课:模型性能评估
1) 回归模型的精度刻画
2) 分类模型的精度刻画
3) 案例:信用卡的欺诈识别
第十二课:走近经典
1) EM算法
2) MCMC算法
3) 主成分分析
4) 案例:信用卡的欺诈识别模型中的降维
第十三课:被忽视的也是最重要的
1) 数据质量检验
2) 特征工程
3) 案例:信用卡的欺诈识别
授课时间:
课程将于2018年7月21日开课,课程持续时间大约为15周。
授课对象:
对信贷风控业务有需求,但是算法基础和编程能力较薄弱的学员
预期收获:
熟悉常用的风控算法,能编写程序进行模型训练
授课讲师:
晓风,硕士毕业于全球top10的统计系,在银行、互金等领域有超过8年的工作经验,在PNAS等核心刊物上发表多篇数据分析领域的文章,带领团队负责多个风控模型的开发与落地工作。
点击下方二维码或阅读原文报名课程: