ICLR 2020 系列论文解读公开课第四期,就在本周二 20:00 整(北京时间)。
AI科技评论 x AI研习社联合出品
针对ICLR 2020不能现场参会的特殊情况,AI研习社联合AI科技评论组织策划了【ICLR 2020 系列专题】活动,【ICLR 2020系列论文解读公开课】是其中重要的组成部分,另外还包括系列论文文字解读,会议数据分析,会议资源下载等。
疫情拉开了大家的距离,但是学术交流是不会就因为疫情被阻挡的,我们愿架起这座学者之间的桥梁,以最短路径,让更多学者能更快的参与其中,促进学术交流,让知识真正流动!
本次直播为【ICLR 2020 系列论文解读公开课】第四期,此论文
来自华为诺亚实验室
的 ICLR 2020满分论文《
Causal Discovery with Reinforcement Learning
》,我们有幸请到了论文的一作、华为诺亚方舟实验室高级研究员
朱胜宇
博士带来“
基于强化学习的因果发现
”的分享。
论文简介如下:
论文地址:https://arxiv.org/pdf/1906.04477.pdf
因果研究作为下一个潜在的热点,已经吸引了机器学习/深度学习领域的的广泛关注,例如Youshua Bengio和Fei-Fei Li近期都有相关的工作。因果研究中一个经典的问题是“因果发现”问题——从被动可观测的数据中发现潜在的因果图结构。
华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中,通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系,结合因果结构的条件,并使用策略梯度的强化学习算法对神经网络参数进行训练,最终得到因果图结构。
在学术界常用的一些数据模型中,该方法在中等规模的图上的表现优于其他方法,包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活,可以和任意的打分函数结合使用。
扫描下方海报二维码,直达直播报名页面:
↓ 点击「阅读原文」,直达直播地址