In this paper, we present a new approach to estimate the layout of a room from its single image. While recent approaches for this task use robust features learnt from data, they resort to optimization for detecting the final layout. In addition to using learnt robust features, our approach learns an additional ranking function to estimate the final layout instead of using optimization. To learn this ranking function, we propose a framework to train a CNN using max-margin structure cost. Also, while most approaches aim at detecting cuboidal layouts, our approach detects non-cuboidal layouts for which we explicitly estimates layout complexity parameters. We use these parameters to propose layout candidates in a novel way. Our approach shows state-of-the-art results on standard datasets with mostly cuboidal layouts and also performs well on a dataset containing rooms with non-cuboidal layouts.
翻译:在本文中, 我们从一个房间的图像中给出了一种新的方法来估计房间的布局。 虽然最近的任务布局使用从数据中汲取的稳健特征, 但它们使用优化的方法来探测最终布局。 除了使用学习的稳健特征外, 我们的方法还学习了额外的排序功能来估计最终布局, 而不是使用优化。 为了学习这一排序功能, 我们建议了一个框架来用最大边距结构成本来训练CNN。 另外, 虽然大多数方法都旨在检测cubodal布局, 我们的方法都检测了我们明确估计布局复杂性参数的非cubidal布局。 我们使用这些参数来以新颖的方式提出布局候选人。 我们的方法展示了标准数据集中最先进的结果, 大多为cobidal布局, 并且还很好地展示了含有非cubid布局的房间的数据集。