传统的多目标跟踪和目标检测是使用单独的系统来完成的,而之前的大多数工作都只关注其中一个方面。跟踪系统显然能从精确的检测中获益,然而,文献中有大量证据表明,检测器可以从跟踪中获益,例如,跟踪可以帮助平滑预测。在这篇论文中,我们关注的是自动驾驶的检测跟踪范式,其中两个任务都是关键的任务。我们提出了一种概念简单而有效的检测和跟踪联合模型,称为RetinaTrack,它改进了目前流行的单阶段视网膜网方法,使其能够适应实例级嵌入训练。我们通过对Waymo开放数据集的评估表明,我们的性能优于最新的跟踪算法,同时所需的计算量显著减少。我们认为,我们简单而有效的方法可以作为这一领域今后工作的有力基础。