For distributions p and q with different supports, the divergence D(p|q) may not exist. We define a spread divergence on modified p and q and describe sufficient conditions for the existence of such a divergence. We demonstrate how to maximize the discriminatory power of a given divergence by parameterizing and learning the spread. We also give examples of using a spread divergence to train and improve implicit generative models, including linear models (Independent Components Analysis) and non-linear models (Deep Generative Networks).
翻译:对于有不同支持的分布 p 和 q, 差异 D (p ⁇ q) 可能不存在 。 我们定义了修改 p 和 q 上的分布差异, 并描述了存在这种差异的足够条件 。 我们通过参数化和学习分布, 展示了如何最大限度地扩大特定差异的歧视性力量 。 我们还举例说明了使用分布差异来培训和改进隐含的基因模型, 包括线性模型( 独立构件分析) 和非线性模型( 深基因网络 ) 。