会员服务 ·

0

直播丨华为诺亚方舟ICLR满分论文：基于强化学习的因果发现

2020 年 3 月 30 日 AI科技评论

ICLR 2020 系列论文解读公开课第四期，就在本周二 20:00 整（北京时间）。

AI科技评论 x AI研习社联合出品

针对ICLR 2020不能现场参会的特殊情况，AI研习社联合AI科技评论组织策划了【ICLR 2020 系列专题】活动，【ICLR 2020系列论文解读公开课】是其中重要的组成部分，另外还包括系列论文文字解读，会议数据分析，会议资源下载等。

疫情拉开了大家的距离，但是学术交流是不会就因为疫情被阻挡的，我们愿架起这座学者之间的桥梁，以最短路径，让更多学者能更快的参与其中，促进学术交流，让知识真正流动！

本次直播为【ICLR 2020 系列论文解读公开课】第四期，此论文来自华为诺亚实验室的 ICLR 2020满分论文《 Causal Discovery with Reinforcement Learning 》，我们有幸请到了论文的一作、华为诺亚方舟实验室高级研究员 朱胜宇 博士带来“ 基于强化学习的因果发现 ”的分享。

论文简介如下：

论文地址：https://arxiv.org/pdf/1906.04477.pdf

因果研究作为下一个潜在的热点，已经吸引了机器学习/深度学习领域的的广泛关注，例如Youshua Bengio和Fei-Fei Li近期都有相关的工作。因果研究中一个经典的问题是“因果发现”问题——从被动可观测的数据中发现潜在的因果图结构。

华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中，通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系，结合因果结构的条件，并使用策略梯度的强化学习算法对神经网络参数进行训练，最终得到因果图结构。

在学术界常用的一些数据模型中，该方法在中等规模的图上的表现优于其他方法，包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活，可以和任意的打分函数结合使用。

扫描下方海报二维码，直达直播报名页面：

↓ 点击「阅读原文」，直达直播地址

登录查看更多

0

相关内容

因果发现

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

专知会员服务

56+阅读 · 2020年2月10日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

【强化学习最新综述】详解强化学习当前进展及未来方向

专知会员服务

238+阅读 · 2020年1月23日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

30+阅读 · 2020年1月11日

【AAAI2020论文】GMAN：基于图多注意力网络的交通检测（GMAN: A Graph Multi-Attention Network for Traffic Prediction），范晓亮，戚建中等

【AAAI2020论文】GMAN：基于图多注意力网络的交通检测（GMAN: A Graph Multi-Attention Network for Traffic Prediction），范晓亮，戚建中等

专知会员服务

76+阅读 · 2019年11月22日

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

专知会员服务

55+阅读 · 2019年9月26日

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

学术头条

15+阅读 · 2019年12月25日

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

机器之心

11+阅读 · 2019年11月21日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

35+阅读 · 2019年6月23日

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

ICLR 2019论文解读：深度学习应用于复杂系统控制

ICLR 2019论文解读：深度学习应用于复杂系统控制

机器之心

11+阅读 · 2019年1月10日

直播 | 大讲堂：基于小波变换的图卷积神经网络

直播 | 大讲堂：基于小波变换的图卷积神经网络

AI科技评论

8+阅读 · 2019年1月3日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

PaperWeekly

17+阅读 · 2018年12月5日

直播 | 自然语言处理中的多任务学习 & 复旦大学NLP实验室介绍

直播 | 自然语言处理中的多任务学习 & 复旦大学NLP实验室介绍

AI科技评论

6+阅读 · 2018年10月22日

直播 | ICLR论文解读：如何利用变分自编码模型框架求解深度主题模型

直播 | ICLR论文解读：如何利用变分自编码模型框架求解深度主题模型

AI科技评论

7+阅读 · 2018年5月5日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

Attention Forcing for Sequence-to-sequence Model Training

Attention Forcing for Sequence-to-sequence Model Training

Arxiv

7+阅读 · 2019年9月26日

Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis

Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis

Arxiv

3+阅读 · 2019年6月26日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

A Hierarchical Neural Network for Sequence-to-Sequences Learning

A Hierarchical Neural Network for Sequence-to-Sequences Learning

Arxiv

4+阅读 · 2018年11月23日

Image Captioning based on Deep Reinforcement Learning

Image Captioning based on Deep Reinforcement Learning

Arxiv

9+阅读 · 2018年9月13日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Show, Tell and Discriminate: Image Captioning by Self-retrieval with Partially Labeled Data

Arxiv

8+阅读 · 2018年3月22日

VIP会员

相关主题

相关VIP内容

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

【KDD2020】Connecting the Dots: 基于图神经网络的多元时间序列预测

专知会员服务

130+阅读 · 2020年7月6日

因果关联学习，Causal Relational Learning

因果关联学习，Causal Relational Learning

专知会员服务

185+阅读 · 2020年4月21日

【ICML2020投稿论文-DeepMind】时序差分学习的推理与泛化，Temporal Difference Learning

专知会员服务

26+阅读 · 2020年3月16日

AAAI 2020 | 滴滴&东北大学提出自动结构化剪枝压缩算法框架，性能提升高达120倍

专知会员服务

30+阅读 · 2020年2月26日

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

【WWW2020-华为诺亚方舟论文】元学习推荐系统MetaSelector

专知会员服务

56+阅读 · 2020年2月10日

【AAAI2020教程】强化学习中的Exploration-Exploitation in Reinforcement Learning

专知会员服务

101+阅读 · 2020年2月8日

【强化学习最新综述】详解强化学习当前进展及未来方向

专知会员服务

238+阅读 · 2020年1月23日

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

【AISTATS2020接受论文】时空对齐，过空间和时间的最优transport（Spatio-Temporal Alignments: Optimal transport through space and time）

专知会员服务

30+阅读 · 2020年1月11日

【AAAI2020论文】GMAN：基于图多注意力网络的交通检测（GMAN: A Graph Multi-Attention Network for Traffic Prediction），范晓亮，戚建中等

【AAAI2020论文】GMAN：基于图多注意力网络的交通检测（GMAN: A Graph Multi-Attention Network for Traffic Prediction），范晓亮，戚建中等

专知会员服务

76+阅读 · 2019年11月22日

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

【图灵奖Yoshua Bengio】ICLR2020论文：一个元转移的目标学习解开因果机制（A Meta-Transfer Objective for Learning to Disentangle Causal Mechanisms）

专知会员服务

55+阅读 · 2019年9月26日

热门VIP内容

开通专知VIP会员享更多权益服务

《物联网（IoT）中的无人机通信高效控制》135页

《在GNSS信号降级环境中利用共识实现无人机集群稳健协调》

中程单向攻击无人机的战略意义：俄乌战争启示

《面向无人机集群的避障动态传感器覆盖算法》最新38页

相关资讯

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

图灵奖Yoshua Bengio ICLR 2020再出新作：通过元学习发掘因果机制

学术头条

15+阅读 · 2019年12月25日

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

今晚，华为诺亚方舟NeurIPS 2019论文分享：基于少量数据的神经网络模型压缩技术

机器之心

11+阅读 · 2019年11月21日

论文浅尝 | 时序与因果关系联合推理

论文浅尝 | 时序与因果关系联合推理

开放知识图谱

35+阅读 · 2019年6月23日

AAAI 2019 | 基于分层强化学习的关系抽取

AAAI 2019 | 基于分层强化学习的关系抽取

PaperWeekly

20+阅读 · 2019年3月27日

ICLR 2019论文解读：深度学习应用于复杂系统控制

ICLR 2019论文解读：深度学习应用于复杂系统控制

机器之心

11+阅读 · 2019年1月10日

直播 | 大讲堂：基于小波变换的图卷积神经网络

直播 | 大讲堂：基于小波变换的图卷积神经网络

AI科技评论

8+阅读 · 2019年1月3日

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

ACL 2018 论文解读 | 基于深度强化学习的远程监督关系抽取

PaperWeekly

17+阅读 · 2018年12月5日

直播 | 自然语言处理中的多任务学习 & 复旦大学NLP实验室介绍

直播 | 自然语言处理中的多任务学习 & 复旦大学NLP实验室介绍

AI科技评论

6+阅读 · 2018年10月22日

直播 | ICLR论文解读：如何利用变分自编码模型框架求解深度主题模型

直播 | ICLR论文解读：如何利用变分自编码模型框架求解深度主题模型

AI科技评论

7+阅读 · 2018年5月5日

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

今晚直播 | 基于生成模型的事件流研究 + NIPS 2017 论文解读

PaperWeekly

5+阅读 · 2017年12月20日

相关论文

Attention Forcing for Sequence-to-sequence Model Training

Attention Forcing for Sequence-to-sequence Model Training

Arxiv

7+阅读 · 2019年9月26日

Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis

Eliciting Knowledge from Experts:Automatic Transcript Parsing for Cognitive Task Analysis

Arxiv

3+阅读 · 2019年6月26日

Unsupervised Image Captioning

Arxiv

7+阅读 · 2018年11月27日

A Hierarchical Neural Network for Sequence-to-Sequences Learning

A Hierarchical Neural Network for Sequence-to-Sequences Learning

Arxiv

4+阅读 · 2018年11月23日

Image Captioning based on Deep Reinforcement Learning

Image Captioning based on Deep Reinforcement Learning

Arxiv

9+阅读 · 2018年9月13日

Causal Embeddings for Recommendation

Arxiv

23+阅读 · 2018年8月3日

A Multi-Objective Deep Reinforcement Learning Framework

A Multi-Objective Deep Reinforcement Learning Framework

Arxiv

16+阅读 · 2018年6月27日

Multimodal Sentiment Analysis using Hierarchical Fusion with Context Modeling

Arxiv

11+阅读 · 2018年6月16日

Learning to Guide Decoding for Image Captioning

Arxiv

6+阅读 · 2018年4月3日

Show, Tell and Discriminate: Image Captioning by Self-retrieval with Partially Labeled Data

Arxiv

8+阅读 · 2018年3月22日

大家都在搜

大型语言模型

CMU博士论文

久别重逢话双塔

软件无线电

国防科技创新

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员