生成流网络(GFlowNets)在主动学习环境中采样多样化的候选集合的一种方法,其训练目标是使它们按照给定的奖励函数的比例近似抽样。在本文中,我们展示了GFlowNets的一些额外的理论性质。它们可以用来估计联合概率分布和相应的边际分布,其中一些变量是未指定的,特别有趣的是,可以表示在集合和图等复合对象上的分布。GFlowNets将通常由计算昂贵的MCMC方法所做的工作摊销在一个单一但经过训练的生成过程中。它们也可以用来估计配分函数和自由能,给定子集(子图)的超集(超图)的条件概率,以及给定集(图)的所有超集(超图)的边际分布。我们引入变量,使熵和互信息的估计,从帕累托边界取样,连接到奖励最大化策略,并扩展到随机环境,连续行动和模块能量函数。

https://www.zhuanzhi.ai/paper/e6adb2c4a1bfad46e20524d5b2d10ef7

成为VIP会员查看完整内容
25

相关内容

专知会员服务
25+阅读 · 2021年9月9日
专知会员服务
41+阅读 · 2021年8月12日
专知会员服务
61+阅读 · 2021年3月12日
【Yoshua Bengio】因果表示学习,附视频与72页ppt
专知会员服务
75+阅读 · 2021年1月7日
专知会员服务
19+阅读 · 2020年9月2日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
247+阅读 · 2020年5月18日
专知会员服务
61+阅读 · 2020年3月4日
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
最新《生成式对抗网络GAN进展》论文
专知
95+阅读 · 2019年4月5日
CVPR 2018 最酷的十篇论文
AI研习社
6+阅读 · 2019年2月13日
深度学习综述:Hinton、Yann LeCun和Bengio经典重读
机器学习算法与Python学习
4+阅读 · 2018年3月22日
零基础概率论入门:最大似然估计
论智
12+阅读 · 2018年1月18日
Arxiv
0+阅读 · 2022年1月21日
GFlowNet Foundations
Arxiv
9+阅读 · 2021年11月17日
Arxiv
64+阅读 · 2021年6月18日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
5+阅读 · 2018年4月22日
VIP会员
相关VIP内容
专知会员服务
25+阅读 · 2021年9月9日
专知会员服务
41+阅读 · 2021年8月12日
专知会员服务
61+阅读 · 2021年3月12日
【Yoshua Bengio】因果表示学习,附视频与72页ppt
专知会员服务
75+阅读 · 2021年1月7日
专知会员服务
19+阅读 · 2020年9月2日
【经典书】贝叶斯编程,378页pdf,Bayesian Programming
专知会员服务
247+阅读 · 2020年5月18日
专知会员服务
61+阅读 · 2020年3月4日
相关资讯
【ICML2021】因果匹配领域泛化
专知
12+阅读 · 2021年8月12日
最新《生成式对抗网络GAN进展》论文
专知
95+阅读 · 2019年4月5日
CVPR 2018 最酷的十篇论文
AI研习社
6+阅读 · 2019年2月13日
深度学习综述:Hinton、Yann LeCun和Bengio经典重读
机器学习算法与Python学习
4+阅读 · 2018年3月22日
零基础概率论入门:最大似然估计
论智
12+阅读 · 2018年1月18日
相关论文
Arxiv
0+阅读 · 2022年1月21日
GFlowNet Foundations
Arxiv
9+阅读 · 2021年11月17日
Arxiv
64+阅读 · 2021年6月18日
Deflecting Adversarial Attacks
Arxiv
8+阅读 · 2020年2月18日
Neural Arithmetic Logic Units
Arxiv
5+阅读 · 2018年8月1日
Arxiv
5+阅读 · 2018年4月22日
微信扫码咨询专知VIP会员