Behavior prediction models have proliferated in recent years, especially in the popular real-world robotics application of autonomous driving, where representing the distribution over possible futures of moving agents is essential for safe and comfortable motion planning. In these models, the choice of coordinate frames to represent inputs and outputs has crucial trade offs which broadly fall into one of two categories. Agent-centric models transform inputs and perform inference in agent-centric coordinates. These models are intrinsically invariant to translation and rotation between scene elements, are best-performing on public leaderboards, but scale quadratically with the number of agents and scene elements. Scene-centric models use a fixed coordinate system to process all agents. This gives them the advantage of sharing representations among all agents, offering efficient amortized inference computation which scales linearly with the number of agents. However, these models have to learn invariance to translation and rotation between scene elements, and typically underperform agent-centric models. In this work, we develop knowledge distillation techniques between probabilistic motion forecasting models, and apply these techniques to close the gap in performance between agent-centric and scene-centric models. This improves scene-centric model performance by 13.2% on the public Argoverse benchmark, 7.8% on Waymo Open Dataset and up to 9.4% on a large In-House dataset. These improved scene-centric models rank highly in public leaderboards and are up to 15 times more efficient than their agent-centric teacher counterparts in busy scenes.
翻译:近年来,行为预测模型已经扩散,特别是在流行的真实世界机器人自动驾驶的应用中,自动驾驶的自主驱动应用中,代表移动剂在可能的未来分配对于安全和舒适的动作规划至关重要。在这些模型中,选择代表投入和产出的坐标框架具有重要的交换关系,这些交换关系大致可分为两类。以物剂为中心的模型转换输入,并在以物剂为中心的坐标中进行推论。这些模型本质上不易翻译和轮换,在公共领导板上表现最佳,但与代理器和场景要素的数量成比例。以环境为中心的模型为中心,使用固定的协调系统处理所有代理物。这使它们拥有在所有代理商之间分享代表面的优势,提供高效的摊销和产物产输出的推论计算方法,这种计算方法与物剂的数量成直线相当。然而,这些模型必须学会在场景元素之间的翻译和轮换不均匀的物剂中心模型之间不易变,在稳定性动作预测模型之间发展知识蒸馏技术,并运用这些技术来缩小代理人-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-区域-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-数据模型之间-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心-中心