详解凸优化、图神经网络、强化学习、贝叶斯方法等四大主题

2021 年 7 月 15 日 夕小瑶的卖萌屋

如果你准备发AI方向的论文，或准备从事科研工作或已在企业中担任AI算法岗的工作。那么我真诚的向大家推荐，贪心学院《高阶机器学习研修班》，目前全网上应该找不到类似体系化的课程。课程精选了四大主题进行深入的剖析讲解，四个模块分别为凸优化、图神经网络、强化学习、贝叶斯深度学习。

适合什么样的人来参加呐？

从事AI行业多年，但技术上感觉不够深入， 遇到了瓶颈；
停留在使用模型/工具上，很难基于业务场景来 提出新的模型；
对于机器学习背后的优化理论、前沿的 技术不够深入；
计划从事尖端的科研、研究工作、 申请AI领域研究生、博士生；
打算进入顶尖的AI公司如Google，Facebook，Amazon，阿里等；
读ICML，IJCAI等会议文章比较吃力，似懂非懂， 无法把每个细节理解透。

如果对课程感兴趣，请联系

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇

01 课程大纲

课程内容上做了 大幅度的更新，一方面新增了对 前沿主题的讲解如图神经网络（GCN,GAT等） ，对核心部分 （如凸优化、强化学习）加大了对理论层面上的深度。 除此之外，也会包含 科研方法论、元学习、解释性、Fair learning等系列主题。 课程采用 全程直播授课 模式。

模块一：凸优化

第一章：凸优化介绍

| 从优化角度理解机器学习

| 凸优化的重要性

| 常见的凸优化问题

| 线性规划以及Simplex Method

| Stochastic LP

| 运输问题讲解

| 投放优化问题讲解

第二章：判定凸函数

| 凸集的判断

| First-order Convexity

| Second-order convexity

| Operations preserve convexity

| 二次规划问题（QP)

| 最小二乘问题

| 股票投资组合优化

第三章：常见的凸优化问题

| 常见的凸优化问题类别

| 半定规划问题（semi-definite programming）

| 几何规划问题（geometric programming）

| 非凸函数的优化

| 松弛化（relaxazation）

| 整数规划（integer programming）

| 打车中的匹配问题

第四章：优化与量化投资

| 量化投资概述

| 如何阅读K线图

| 基于规则的量化策略

| 基于多因子模型的量化策略

| 基于机器学习模型的量化策略

| 基于LP， QP优化的量化策略

| Efficient Frontier, Sharp Ratio

| 量化平台：量化策略编写实战作业讲解SDP

第五周：对偶（Duality）

| 拉格朗日对偶函数

| 对偶的几何意义

| Weak and Strong Duality

| KKT条件

| LP, QP, SDP的对偶问题

| 对偶的其他应用

| 典机器学习模型的对偶推导及实现

第六章：一阶与二阶优化技术

| Gradient Descent

| Subgradient Method

| Proximal Gradient Descent

| Projected Gradient Descent

| Stochastic Gradient Descent与收敛

| Newton's Method

| Quasi-Newton Method

| L-BFGS

第七章：优化技术进阶

| Mirror Ascent

| 分布式SGD

| Interior Point Method

| ADMM

| Sparsity与优化

| Combinatorial优化

模块二图神经网络

第一章：数学部分（1）

| 空间向量和图论

| Inner Product, Hilbert Space

| 傅里叶变化

| Eigenfunction, Eigenvalue

| CNN的卷积和池化

| 介绍cnn的卷积层

| 如何卷积，信息如何传递

| 池化层的作用和基本设计

第二章：数学部分（2）

| Subgraph

| Network Motif

| Network Community Detection

| 拉普拉斯算子

| 拉普拉斯矩阵

| SVD

| QR分解

| 基本向量机分解

| block分解

| 拉普拉斯算子和矩阵的数学意义

第三章：图卷积

| 卷积的几何意义

| 图卷积

| ChebNet

| GCN

| Graph Pooling

| MCMC介绍

| Importance Sampling

| Rejection Sampling

第四章：边嵌入的图卷积

| Spatial Convolution

| Mixture Model Network

| Attention机制

| Graph attention network

| Edge Convolution

| 近似优化问题

| 减少计算量的介绍

第五章：图卷积的应用

| NRI

| Relative GCN

| Knowledge GCN

| ST-GCN

| Graphsage的设计

| Graphsage的应用

第六章：GNN的相关模型

| GNN

| Deepwalk

| Node2vec

| Struc2vec

| HyperGCN

| HGCN的设计和应用

模块三强化学习

第一章：强化学习基础（1）

| Markov Decision Process

| Bellman Equation

| Dynamic Programming

| Model-free Prediction

| Monte Carlo Learning

| TD Learning

第二章：强化学习基础（2）

| Model free Control

| On-Policy Monte Carlo Control

| On-Policy TD Learning

| SARSA, SARSA Lambda

| Off-policy

| Importance Sampling, Q-Learning

第三章：强化学习基础（3）

| Policy Gradient

| Deep Reinforcement Learning

| Actor Critic

| Advanced Reinforcement Learning

第四章：探索、实施、推荐系统

| Multi Armed Bandits

| Explore and Exploit

| Thompson Sampling

| Epsilon Greegy

| Upper Confidence Bound

| Reinforcement Learning and Recommendation system

| Epsilon greedy

| UCB

第五章：多智能体的强化学习与稀疏Reward设计

| Multi agent Reinforcement Learning

| Sparse reward Design

| Inverse RL

| Master the game of Go without human knowledge

| AlphaGo 围棋强化学习论文解读

第六章：强化学习在NLP、量化、游戏中的应用

| Reinforcement Learning Application

| Reinforcement Learning with NLP

| Reinforcment Learning with quatitive trading

| Reinforcement Learning with Game.

| SeqGan 代码讲解

模块四贝叶斯深度学习

第一章：贝叶斯机器学习介绍

| 贝叶斯定理

| MLE，MAP以及贝叶斯估计

| 集成模型与贝叶斯方法比较

| 贝叶斯推理中的困难

| 贝叶斯近似算法介绍

| 贝叶斯线性回归

| 案例：基于贝叶斯线性回归的股价预测

| 线性回归于岭回归

| 贝叶斯线性回归模型

| Probabilistic Programming

| Edwin的使用以及实战

第二章：贝叶斯NB与LDA

| 从朴素贝叶斯到贝叶斯朴素贝叶斯

| 贝叶斯朴素贝叶斯模型的生成过程

| 概率图表示方法

| 主题模型的应用

| 主题模型的生成过程

| 基于LDA的文本分析

| LDA的应用场景

| LDA应用在文本分析中

| LDA代码剖析

第三章：MCMC采样技术

| MCMC采样技术介绍

| 吉布斯采样

| Bayesian NB的求解

| LDA与吉布斯采样

| 各类采样技术

| Importance Sampling

| Rejection Sampling

第四章：变分法技术

| KL散度

| ELBo的构造

| 变分法目标函数

| 坐标下降法

| 求解LDA的参数

| 基于贝叶斯深度学习的推荐系统搭建

| SVI的介绍

| 贝叶斯深度学习

| 基于SVI的求解

第五章：贝叶斯深度学习

| 贝叶斯深度学习的应用

| 贝叶斯与VAE

| Reparameterization Trick

| 深度生成模型

| 基于VAE的文本生成

| 贝叶斯模型与不确定性

| MC Dropout介绍

| MC Dropout证明

第六章：贝叶斯深度学习与自然语言处理

| 贝叶斯序列模型

| 词性标注于实体识别

| 基于贝叶斯图神经网络的文本分析

| 基于贝叶斯神经网络的命名实体识别

| Adversial Learning介绍

| Adversial Attack

| 基于GNN的Adversial Learning

第七章：高斯过程与贝叶斯优化

| 高斯分布

| 高斯过程

| 超参数的学习

| AutoML技术

| 贝叶斯优化及应用

02 部分案例和项目

学员可以选择每个模块完成我们提供的固定项目（以个人为单位），或者以小组为单位完成一个 开放式项目（capstone） ，当然你也可以提出你自己的项目。从项目的立项、中期验收到最终答辩，在这个过程中我们的导师团队会给你建议、并 辅助你完成课题 ，该课题最终很有可能成为你 的创业项目或科研论文！

优化与量化投资：量化投资作为金融领域一大分支，今年来受到了很大的关注。在这个项目中，我们将使用在课程中已学过的优化技术来搭建买卖策略，并在平台上做回测，最终得到策略的效果。

这个项目的主要目的有以下几种：

1. 了解并掌握量化投资领域，虽然跟很多人的工作关系不大，但毕竟是一个新兴领域，而且跟 AI 技术的结合比较紧密，强烈建议借此机会学习。

2. 掌握并实战优化技术，通过编写真正的策略会真正明白优化技术如何应用在工业界环境中。

3. 基于给定的优化方法，自己试着去改进并创造新的优化方法，让回测效果更好。

涉及到的知识点： 量化投资，凸优化，二次规划

基于GCN的链路预测：社交数据或者推荐系统数据中，拥有一群用户，有些用户是朋友关系，而有些朋友可能是潜在朋友关系。这个项目，需要精准地预测用户之间的关系，是否会形成朋友关系，做到用户之间的准确推荐。首先，需要将问题进行数学建模，构建图矩阵和特征矩阵，然后再将构建的矩阵，放入GCN中，进行训练，提升结果。在这个项目里，图矩阵是需要自己创建，其次，GCN模型，可以进行修改，变成GCN+attention，或Edge- GCN, 或 GCN-smoothing. 最后衡量预测效果。

涉及到的知识点： Graph Theory、GCN和Attention、Weighted Graph、Smoothing label

基于HFO 场景的强化学习模型及基于Flappy Bird 场景的深度强化学习：本项目 (coursework) 旨在实践并设计强化学习算法来探索，解决解决强化学习问题。其中包括模拟HFO （ Half Field Offence）及 Flappy Bird。通过此项目，期望同学们能充分理解，并可掌握，应用（但不限于）：状态State, 动作Action, MDP（马尔可夫决策过程）。

State value function ，State Action value function 如何进行估计，迭代及预测。深度神经网络强化学习对Value Approximation进行评估, 并进行Policy优化。Exploration 和 Exploitation 的平衡优化也将会在本项目的最后进行探索。

涉及到的知识点： MDP建模， Q Learning, Monte Carlo Control , Value iteration, Deep Q Learning

基于修改版LDA的无监督情感分析模型：本项目的目的是如何基于LDA来自动抽取文本中的情感，这个项目涉及到对于LDA模型的改造以及对于新模型的推导，具有一定的挑战。在本项目中，我们会一步步引导学员去设计模型，并对模型做出吉布斯采样的全部推导过程以及实现环节。通过此项目，学员会亲身体会整个贝叶斯模型的设计和训练过程。

涉及到的知识点：主题模型，吉布斯采样，Collapsed吉布斯采样，无监督情感分析

如果对课程感兴趣，请联系

添加课程顾问小姐姐微信

报名、课程咨询

👇👇👇

03 授课导师

李文哲： 贪心科技创始人兼CEO，人工智能和知识图谱领域专家，曾任金融科技独角兽公司的首席科学家、美国亚马逊的高级工程师，美国南加州大学博士，在荷兰访问期间，师从AI顶级学者Max Welling教授。。并在AAAI、KDD、AISTATS等顶会上发表过15篇以上论文，并荣获IAAI，IPDPS的最佳论文奖。

杨栋： 香港城市大学博士, UC Merced博士后，主要从事于机器学习，图卷积，图嵌入的研究。先后在ECCV, Trans on Cybernetics, Trans on NSE, INDIN等国际顶会及期刊上发表过数篇论文。

04直播授课，现场推导演示

区别于劣质的PPT讲解，导师全程现场推导，让你在学习中有清晰的思路，深刻的理解算法模型背后推导的每个细节。更重要的是可以清晰地看到各种模型之间的关系！帮助你打通六脉！