Predicting the future trajectories of multiple interacting agents in a scene has become an increasingly important problem for many different applications ranging from control of autonomous vehicles and social robots to security and surveillance. This problem is compounded by the presence of social interactions between humans and their physical interactions with the scene. While the existing literature has explored some of these cues, they mainly ignored the multimodal nature of each human's future trajectory. In this paper, we present Social-BiGAT, a graph-based generative adversarial network that generates realistic, multimodal trajectory predictions by better modelling the social interactions of pedestrians in a scene. Our method is based on a graph attention network (GAT) that learns reliable feature representations that encode the social interactions between humans in the scene, and a recurrent encoder-decoder architecture that is trained adversarially to predict, based on the features, the humans' paths. We explicitly account for the multimodal nature of the prediction problem by forming a reversible transformation between each scene and its latent noise vector, as in Bicycle-GAN. We show that our framework achieves state-of-the-art performance comparing it to several baselines on existing trajectory forecasting benchmarks.


翻译:预测一个场景中多个互动剂的未来轨迹已成为许多不同应用的日益重要问题,从控制自主车辆和社会机器人到安全和监视等,这个问题由于人类之间的社会互动及其与场景的物理互动而变得更加复杂。虽然现有文献探讨了其中的一些提示,但主要忽视了每个人类未来轨迹的多式性质。在本文中,我们介绍了社会-BiGAT,这是一个基于图形的基因对抗网络,它通过更好地模拟一个场景中行人的社会互动而产生现实的多式轨迹预测。我们的方法基于一个图形关注网络(GAT),它学习可靠的地貌表现,记录了现场人之间的社会互动,以及一个经常性的编码器解码器结构,这种结构经过了对抗性的培训,可以根据这些特征预测人类未来轨迹。我们明确地解释了预测问题的多式性质,在每一场景及其潜在噪声矢量之间形成可逆转的转变,就像在Bicyclo-GAN中那样。我们展示了我们的框架实现了对当前几条基线轨迹进行对比的状态的状态预测。

6
下载
关闭预览

相关内容

IFIP TC13 Conference on Human-Computer Interaction是人机交互领域的研究者和实践者展示其工作的重要平台。多年来,这些会议吸引了来自几个国家和文化的研究人员。官网链接:http://interact2019.org/
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
开源书:PyTorch深度学习起步
专知会员服务
50+阅读 · 2019年10月11日
GAN新书《生成式深度学习》,Generative Deep Learning,379页pdf
专知会员服务
202+阅读 · 2019年9月30日
内涵网络嵌入:Content-rich Network Embedding
我爱读PAMI
4+阅读 · 2019年11月5日
深度学习的下一步:Transformer和注意力机制
云头条
56+阅读 · 2019年9月14日
Transferring Knowledge across Learning Processes
CreateAMind
27+阅读 · 2019年5月18日
基于Lattice LSTM的命名实体识别
微信AI
47+阅读 · 2018年10月19日
【跟踪Tracking】15篇论文+代码 | 中秋快乐~
专知
18+阅读 · 2018年9月24日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Adversarial Variational Bayes: Unifying VAE and GAN 代码
CreateAMind
7+阅读 · 2017年10月4日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Seeing What a GAN Cannot Generate
Arxiv
8+阅读 · 2019年10月24日
Arxiv
15+阅读 · 2019年4月4日
Arxiv
5+阅读 · 2018年4月30日
Arxiv
3+阅读 · 2018年3月29日
Arxiv
9+阅读 · 2018年3月10日
VIP会员
相关资讯
Top
微信扫码咨询专知VIP会员