Discriminative latent variable models (LVM) are frequently applied to various visual recognition tasks. In these systems the latent (hidden) variables provide a formalism for modeling structured variation of visual features. Conventionally, latent variables are de- fined on the variation of the foreground (positive) class. In this work we augment LVMs to include negative latent variables corresponding to the background class. We formalize the scoring function of such a generalized LVM (GLVM). Then we discuss a framework for learning a model based on the GLVM scoring function. We theoretically showcase how some of the current visual recognition methods can benefit from this generalization. Finally, we experiment on a generalized form of Deformable Part Models with negative latent variables and show significant improvements on two different detection tasks.
翻译:各种视觉识别任务经常使用隐性潜在差异模型(LVM)。在这些系统中,潜在(隐性)变量为视觉特征结构变异的建模提供了一种形式化的模型。 通常, 潜在变量会因前景( 正面) 类别的变化而取消罚款。 在这项工作中, 我们增加LVM( LVM) 以纳入与背景类别相应的负潜在变量。 我们正式确定这样一个通用的LVM( GLVM) 的评分功能。 然后我们讨论一个学习基于 GLVM 评分功能的模型的框架。 我们理论上展示了当前某些视觉识别方法如何从这种概括化中受益。 最后, 我们实验了一种通用形式的变形部分模型, 并用负面潜在变量来显示两种不同的检测任务的重大改进 。