How do we build a general and broad object detection system? We use all labels of all concepts ever annotated. These labels span diverse datasets with potentially inconsistent taxonomies. In this paper, we present a simple method for training a unified detector on multiple large-scale datasets. We use dataset-specific training protocols and losses, but share a common detection architecture with dataset-specific outputs. We show how to automatically integrate these dataset-specific outputs into a common semantic taxonomy. In contrast to prior work, our approach does not require manual taxonomy reconciliation. Our multi-dataset detector performs as well as dataset-specific models on each training domain, but generalizes much better to new unseen domains. Entries based on the presented methodology ranked first in the object detection and instance segmentation tracks of the ECCV 2020 Robust Vision Challenge.
翻译:我们如何构建一个通用和宽度天体探测系统? 我们如何构建一个通用和宽度天体探测系统? 我们使用所有被附加说明的所有概念的所有标签。 这些标签覆盖了不同数据集, 可能存在不一致的分类。 在本文中, 我们提出了一个简单的方法, 用于对多个大型数据集的统一探测器进行培训。 我们使用特定数据集的培训规程和损失, 但与特定数据集产出共享一个共同的检测架构。 我们展示了如何将这些数据集特定产出自动整合到一个共同的语义分类学。 与以往的工作不同, 我们的方法并不需要手动分类校对对。 我们的多数据集探测器运行以及每个培训领域的数据集特定模型, 但也比新的隐形域要好得多。 基于所提出的方法的条目在 ECCV 2020 Robust V Robust Vision 挑战 的天体探测和实例分割轨道上排位第一。