How do we build a general and broad object detection system? We use all labels of all concepts ever annotated. These labels span diverse datasets with potentially inconsistent taxonomies. In this paper, we present a simple method for training a unified detector on multiple large-scale datasets. We use dataset-specific training protocols and losses, but share a common detection architecture with dataset-specific outputs. We show how to automatically integrate these dataset-specific outputs into a common semantic taxonomy. In contrast to prior work, our approach does not require manual taxonomy reconciliation. Experiments show our learned taxonomy outperforms a expert-designed taxonomy in all datasets. Our multi-dataset detector performs as well as dataset-specific models on each training domain, and can generalize to new unseen dataset without fine-tuning on them. Code is available at https://github.com/xingyizhou/UniDet.
翻译:我们如何构建一个通用和宽度天体探测系统? 我们如何构建一个通用和宽度天体探测系统? 我们使用所有被附加说明的所有概念的所有标签。 这些标签覆盖了不同数据集, 可能存在不一致的分类。 在本文中, 我们提出了一个简单的方法, 用于培训一个统一的探测器, 有关多个大型数据集。 我们使用特定数据集的培训协议和损失, 但使用特定数据集的具体产出共享一个共同的检测架构 。 我们展示了如何将这些数据集的具体产出自动整合到一个共同的语义分类分类学中。 与以往的工作不同, 我们的方法并不需要手动的分类调和。 实验显示我们所学的分类学超越了所有数据集中专家设计的分类学。 我们的多数据集检测器和每个培训领域的特定数据集模型运行, 并且可以在不对其进行微调的情况下普及新的不可见数据集。 代码可在 https://github.com/xingyyuzhou/UniDet上查阅 。