生成流网络(GFlowNets)在主动学习环境中采样多样化的候选集合的一种方法,其训练目标是使它们按照给定的奖励函数的比例近似抽样。在本文中,我们展示了GFlowNets的一些额外的理论性质。它们可以用来估计联合概率分布和相应的边际分布,其中一些变量是未指定的,特别有趣的是,可以表示在集合和图等复合对象上的分布。GFlowNets将通常由计算昂贵的MCMC方法所做的工作摊销在一个单一但经过训练的生成过程中。它们也可以用来估计配分函数和自由能,给定子集(子图)的超集(超图)的条件概率,以及给定集(图)的所有超集(超图)的边际分布。我们引入变量,使熵和互信息的估计,从帕累托边界取样,连接到奖励最大化策略,并扩展到随机环境,连续行动和模块能量函数。
https://www.zhuanzhi.ai/paper/e6adb2c4a1bfad46e20524d5b2d10ef7