详解凸优化、图神经网络、强化学习、贝叶斯方法等四大主题

2021 年 7 月 15 日 夕小瑶的卖萌屋

如果你准备发AI方向的论文,或准备从事科研工作或已在企业中担任AI算法岗的工作。那么我真诚的向大家推荐,贪心学院高阶机器学习研修班》目前全网上应该找不到类似体系化的课程。课程精选了四大主题进行深入的剖析讲解,四个模块分别为凸优化、图神经网络、强化学习、贝叶斯深度学习。



适合什么样的人来参加呐?


  • 从事AI行业多年,但技术上感觉不够深入, 遇到了瓶颈; 
  • 停留在使用模型/工具上,很难基于业务场景来 提出新的模型; 
  • 对于机器学习背后的优化理论、前沿的 技术不够深入;
  • 计划从事尖端的科研、研究工作、 申请AI领域研究生、博士生; 
  • 打算进入顶尖的AI公司如Google,Facebook,Amazon, 阿里等;
  • 读ICML,IJCAI等会议文章比较吃力,似懂非懂, 无法把每个细节理解透。



如果对课程感兴趣,请联系
添加课程顾问小姐姐微信
报名、课程咨询
👇👇👇





01 课程大纲

课程内容上做了 大幅度的更新 一方面新增了对 前沿主题的讲解如图神经网络(GCN,GAT等) ,对核心部分 (如凸优化、强化学习)加大了对理论层面上的深度。 除此之外,也会包含 科研方法论、元学习、解释性、Fair learning等系列主题。 课程采用 全程直播授课 模式。

模块一:凸优化



第一章:凸优化介绍

| 从优化角度理解机器学习

| 凸优化的重要性

| 常见的凸优化问题

| 线性规划以及Simplex Method

| Stochastic LP

| 运输问题讲解

| 投放优化问题讲解

 

第二章:判定凸函数

| 凸集的判断

| First-order Convexity

| Second-order convexity

| Operations preserve convexity

| 二次规划问题(QP)

| 最小二乘问题

| 股票投资组合优化

 

第三章:常见的凸优化问题

| 常见的凸优化问题类别

| 半定规划问题(semi-definite programming)

| 几何规划问题(geometric programming)

| 非凸函数的优化

| 松弛化(relaxazation)

| 整数规划(integer programming)

| 打车中的匹配问题

 

第四章:优化与量化投资

| 量化投资概述

| 如何阅读K线图

| 基于规则的量化策略

| 基于多因子模型的量化策略

| 基于机器学习模型的量化策略

| 基于LP, QP优化的量化策略

| Efficient Frontier, Sharp Ratio

| 量化平台:量化策略编写实战作业讲解SDP

 

第五周:对偶(Duality)

| 拉格朗日对偶函数

| 对偶的几何意义

| Weak and Strong Duality

| KKT条件

| LP, QP, SDP的对偶问题

| 对偶的其他应用

| 典机器学习模型的对偶推导及实现

 

 第六章:一阶与二阶优化技术

| Gradient Descent

| Subgradient Method

| Proximal Gradient Descent

| Projected Gradient Descent

| Stochastic Gradient Descent与收敛

| Newton's Method

| Quasi-Newton Method

| L-BFGS

 

第七章:优化技术进阶

| Mirror Ascent

| 分布式SGD

| Interior Point Method

| ADMM

| Sparsity与优化

| Combinatorial优化



模块二 图神经网络


第一章:数学部分(1)

| 空间向量和图论

| Inner Product, Hilbert Space

| 傅里叶变化

| Eigenfunction, Eigenvalue

| CNN的卷积和池化

| 介绍cnn的卷积层

| 如何卷积,信息如何传递

| 池化层的作用和基本设计

 

第二章:数学部分(2)

| Subgraph

| Network Motif

| Network Community Detection

| 拉普拉斯算子

| 拉普拉斯矩阵

| SVD

| QR分解

| 基本向量机分解

| block分解

| 拉普拉斯算子和矩阵的数学意义


第三章:图卷积

| 卷积的几何意义

| 图卷积

| ChebNet

| GCN

| Graph Pooling

| MCMC介绍

| Importance Sampling

| Rejection Sampling


第四章:边嵌入的图卷积

| Spatial Convolution

| Mixture Model Network

| Attention机制

| Graph attention network

| Edge Convolution

| 近似优化问题

| 减少计算量的介绍


第五章:图卷积的应用

| NRI

| Relative GCN

| Knowledge GCN

| ST-GCN

| Graphsage的设计

| Graphsage的应用


第六章:GNN的相关模型

| GNN

| Deepwalk

| Node2vec

| Struc2vec

| HyperGCN

| HGCN的设计和应用



模块三 强化学习

第一章:强化学习基础(1)

| Markov Decision Process

| Bellman Equation

| Dynamic Programming

| Model-free Prediction

| Monte Carlo Learning

| TD Learning

 

第二章:强化学习基础(2)

| Model free Control

| On-Policy Monte Carlo Control

| On-Policy TD Learning

| SARSA, SARSA Lambda

| Off-policy

| Importance Sampling, Q-Learning

 

第三章:强化学习基础(3)

| Policy Gradient

| Deep Reinforcement Learning

| Actor Critic

| Advanced Reinforcement Learning

 

第四章:探索、实施、推荐系统

| Multi Armed  Bandits

| Explore and Exploit

| Thompson Sampling

| Epsilon Greegy

| Upper Confidence Bound

| Reinforcement Learning and Recommendation system

| Epsilon greedy

| UCB  


第五章:多智能体的强化学习与稀疏Reward设计

| Multi agent Reinforcement Learning

| Sparse reward Design

| Inverse RL

| Master the game of Go without human knowledge

| AlphaGo  围棋强化学习论文解读


第六章:强化学习在NLP、量化、游戏中的应用

| Reinforcement Learning Application

| Reinforcement Learning with NLP

| Reinforcment Learning with quatitive trading

| Reinforcement Learning with Game.

| SeqGan 代码讲解



模块四 贝叶斯深度学习

第一章:贝叶斯机器学习介绍

| 贝叶斯定理

| MLE,MAP以及贝叶斯估计

| 集成模型与贝叶斯方法比较

| 贝叶斯推理中的困难

| 贝叶斯近似算法介绍

| 贝叶斯线性回归

| 案例:基于贝叶斯线性回归的股价预测

| 线性回归于岭回归

| 贝叶斯线性回归模型

| Probabilistic Programming

| Edwin的使用以及实战

 

第二章:贝叶斯NB与LDA

| 从朴素贝叶斯到贝叶斯朴素贝叶斯

| 贝叶斯朴素贝叶斯模型的生成过程

| 概率图表示方法

| 主题模型的应用

| 主题模型的生成过程

| 基于LDA的文本分析

| LDA的应用场景

| LDA应用在文本分析中

| LDA代码剖析

 

第三章:MCMC采样技术

| MCMC采样技术介绍

| 吉布斯采样

| Bayesian NB的求解

| LDA与吉布斯采样

| 各类采样技术

| Importance Sampling

| Rejection Sampling

 

第四章:变分法技术

| KL散度

| ELBo的构造

| 变分法目标函数

| 坐标下降法

| 求解LDA的参数

| 基于贝叶斯深度学习的推荐系统搭建

| SVI的介绍

| 贝叶斯深度学习

| 基于SVI的求解

 

第五章:贝叶斯深度学习

| 贝叶斯深度学习的应用

| 贝叶斯与VAE

| Reparameterization Trick

| 深度生成模型

| 基于VAE的文本生成

| 贝叶斯模型与不确定性

| MC Dropout介绍

| MC Dropout证明

 

第六章:贝叶斯深度学习与自然语言处理

| 贝叶斯序列模型

| 词性标注于实体识别

| 基于贝叶斯图神经网络的文本分析

| 基于贝叶斯神经网络的命名实体识别

| Adversial Learning介绍

| Adversial Attack

| 基于GNN的Adversial Learning

 

第七章:高斯过程与贝叶斯优化

| 高斯分布

| 高斯过程

| 超参数的学习

| AutoML技术

| 贝叶斯优化及应用



02 部分案例和项目

学员可以选择每个模块完成我们提供的固定项目(以个人为单位),或者以小组为单位完成一个 开放式项目(capstone) ,当然你也可以提出你自己的项目。从项目的立项、中期验收到最终答辩,在这个过程中我们的导师团队会给你建议、并 辅助你完成课题 , 该课题最终很有可能成为你 的创业项目或科研论文!

优化与量化投资 量化投资作为金融领域一大分支,今年来受到了很大的关注。在这个项目中,我们将使用在课程中已学过的优化技术来搭建买卖策 略,并在平台上做回测,最终得到策略的效果。
这个项目的主要目的有以下几种:
1. 了解并掌握量化投资领域,虽然跟很多人的工作关系不大,但毕竟是一个新兴领域,而且跟 AI 技术的结合比较紧密,强烈建议借此机会学习。
2. 掌握并实战优化技术,通过编写真正的策略会真正明白优化技术如何应用在工业界环境中。
3. 基于给定的优化方法,自己试着去改进并创造新的优化方法,让回测效果更好。

涉及到的知识点: 量化投资,凸优化,二次规划

基于GCN的链路预测 社交数据或者推荐系统数据中,拥有一群用户,有些用户是朋友关系,而有些朋友可能是潜在朋友关系。这个项目,需要精准地预测用户之间的关系,是否会形成朋友关系,做到用户之间的准确推荐。首先,需要将问题进行数学建模,构建图矩阵和特征矩阵,然后再将构建的矩阵,放入GCN中,进行训练,提升结果。在这个项目里,图矩阵是需要自己创建,其次,GCN模型,可以进行修改,变成GCN+attention, 或Edge- GCN, 或 GCN-smoothing. 最后衡量预测效果。

涉及到的知识点: Graph Theory、GCN和Attention、Weighted Graph、Smoothing label

基于HFO 场景的强化学习模型及基于Flappy Bird 场景的深度强化学习本项目 (coursework) 旨在实践并设计强化学习算法来探索,解决解决强化学习问题。其中包括模拟HFO ( Half Field Offence)及 Flappy Bird。通过此项目,期望同学们能充分理解,并可掌握,应用 (但不限于) :状态State, 动作Action, MDP( 马尔可夫决策过程)。
State value function ,State Action value function 如何进行估计,迭代及预测。深度神经网络强化学习对Value Approximation进行评估, 并进行Policy优化。Exploration 和 Exploitation 的平衡优化也将会在本项目的最后进行探索。

涉及到的知识点: MDP建模, Q Learning, Monte Carlo Control , Value iteration, Deep Q Learning


基于修改版LDA的无监督情感分析模型本项目的目的是如何基于LDA来自动抽取文本中的情感,这个项目涉及到对于LDA模型的改造以及对于新模型的推导,具有一定的挑战。在本项目中,我们会一步步引导学员去设计模型,并对模型做出吉布斯采样的全部推导过程以及实现环节。通过此项目,学员会亲身体会整个贝叶斯模型的设计和训练过程。

涉及到的知识点:主题模型,吉布斯采样,Collapsed吉布斯采样,无监督情感分析




如果对课程感兴趣,请联系
添加课程顾问小姐姐微信
报名、课程咨询
👇👇👇

03 授课导师

李文哲: 贪心科技创始人兼CEO,人工智能和知识图谱领域专家,曾任金融科技独角兽公司的首席科学家、美国亚马逊的高级工程师,美国南加州大学博士,在荷兰访问期间,师从AI顶级学者Max Welling教授。。并在AAAI、KDD、AISTATS等顶会上发表过15篇以上论文,并荣获IAAI,IPDPS的最佳论文奖。
 
杨栋: 香港城市大学博士, UC Merced博士后,主要从事于机器学习,图卷积,图嵌入的研究。先后在ECCV, Trans on Cybernetics, Trans on NSE, INDIN等国际顶会及期刊上发表过数篇论文。


04直播授课,现场推导演示


区别于劣质的PPT讲解,导师全程现场推导,让你在学习中有清晰的思路,深刻的理解算法模型背后推导的每个细节。更重要的是可以清晰地看到各种模型之间的关系!帮助你打通六脉!


▲源自:LDA模型讲解


▲源自:Convex Optimization 讲解
▲源自:Convergence Analysis 讲解


05 完整的项目实践文档

以量化投资的项目为例,使用优化技术来解决。大概1个月的时间。只要按照文档里的步骤自己做就可以,但还是挺有挑战的,比如如何设计策略等等。最后的结果要求在真实的量化平台上去验证,并记录Sharp Ratio等指标,整体来讲项目很有意思,毕竟每个人都有AI炒股的梦吧!
图1:详细的项目文档

图2:详细的项目文档





06 科学的课程安排

采用 直播的授课方式 每周3-4次直播教学,包含核心理论课、实战课、复习巩固课以及论文讲解课。教学模式上也参考了美国顶级院校的教学体系。以下为其中一周的课程安排,供参考。  

 

07 入学标准

1、 理工科专业相关本科生、硕士生、博士生。
2、目前从事AI工作。
3、具备良好的Python编程能力。
4、具备一定机器学习、深度学习基础,零基础学员不太适合。

08 报名须知

1、本课程为收费教学。
2、本期招收学员名额有限
3、品质保障!学习不满意,可在开课后7天内,无条件全额退款。
4、学习本课程需要具备一定的机器学习基础。
●●●
如果对课程感兴趣,请联系
添加课程顾问小姐姐微信
报名、课程咨询
👇👇👇


登录查看更多
2

相关内容

强化学习(RL)是机器学习的一个领域,与软件代理应如何在环境中采取行动以最大化累积奖励的概念有关。除了监督学习和非监督学习外,强化学习是三种基本的机器学习范式之一。 强化学习与监督学习的不同之处在于,不需要呈现带标签的输入/输出对,也不需要显式纠正次优动作。相反,重点是在探索(未知领域)和利用(当前知识)之间找到平衡。 该环境通常以马尔可夫决策过程(MDP)的形式陈述,因为针对这种情况的许多强化学习算法都使用动态编程技术。经典动态规划方法和强化学习算法之间的主要区别在于,后者不假设MDP的确切数学模型,并且针对无法采用精确方法的大型MDP。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
机器学习必读新书-《凸优化算法原理详解》,334页pdf
专知会员服务
97+阅读 · 2022年1月4日
专知会员服务
76+阅读 · 2021年9月27日
专知会员服务
82+阅读 · 2021年7月31日
【哈佛大学】图神经网络用于药物开发,35页ppt
专知会员服务
60+阅读 · 2021年2月3日
Google最新《机器学习对偶性》报告,48页ppt
专知会员服务
36+阅读 · 2020年11月29日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
平安 | 图神经网络/强化学习招聘
图与推荐
0+阅读 · 2021年9月23日
推荐几个NLP出论文的好方向!!
夕小瑶的卖萌屋
1+阅读 · 2021年8月24日
【限时】组队科研项目实战
夕小瑶的卖萌屋
0+阅读 · 2021年7月9日
这可能是你近 2 年发论文最好机会!
专知
0+阅读 · 2021年3月30日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Arxiv
65+阅读 · 2021年6月18日
Interest-aware Message-Passing GCN for Recommendation
Arxiv
12+阅读 · 2021年2月19日
VIP会员
相关VIP内容
机器学习必读新书-《凸优化算法原理详解》,334页pdf
专知会员服务
97+阅读 · 2022年1月4日
专知会员服务
76+阅读 · 2021年9月27日
专知会员服务
82+阅读 · 2021年7月31日
【哈佛大学】图神经网络用于药物开发,35页ppt
专知会员服务
60+阅读 · 2021年2月3日
Google最新《机器学习对偶性》报告,48页ppt
专知会员服务
36+阅读 · 2020年11月29日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
相关资讯
平安 | 图神经网络/强化学习招聘
图与推荐
0+阅读 · 2021年9月23日
推荐几个NLP出论文的好方向!!
夕小瑶的卖萌屋
1+阅读 · 2021年8月24日
【限时】组队科研项目实战
夕小瑶的卖萌屋
0+阅读 · 2021年7月9日
这可能是你近 2 年发论文最好机会!
专知
0+阅读 · 2021年3月30日
机器学习必备手册
机器学习研究会
19+阅读 · 2017年10月24日
相关基金
国家自然科学基金
21+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
国家自然科学基金
5+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
Top
微信扫码咨询专知VIP会员