智能机器人社交感知导航的混合时空图转换和偏好学习 (NaviSTAR: Socially Aware Robot Navigation with Hybrid Spatio-Temporal Graph Transformer and Preference Learning) - 专知论文

会员服务 ·

0

偏好学习 · 时空图 · 社交 · 机器人 · 混合 ·

2023 年 4 月 12 日

NaviSTAR: Socially Aware Robot Navigation with Hybrid Spatio-Temporal Graph Transformer and Preference Learning

翻译：智能机器人社交感知导航的混合时空图转换和偏好学习

Weizheng Wang,Ruiqi Wang,Le Mao,Byung-Cheol Min

Developing robotic technologies for use in human society requires ensuring the safety of robots' navigation behaviors while adhering to pedestrians' expectations and social norms. However, maintaining real-time communication between robots and pedestrians to avoid collisions can be challenging. To address these challenges, we propose a novel socially-aware navigation benchmark called NaviSTAR, which utilizes a hybrid Spatio-Temporal grAph tRansformer (STAR) to understand interactions in human-rich environments fusing potential crowd multi-modal information. We leverage off-policy reinforcement learning algorithm with preference learning to train a policy and a reward function network with supervisor guidance. Additionally, we design a social score function to evaluate the overall performance of social navigation. To compare, we train and test our algorithm and other state-of-the-art methods in both simulator and real-world scenarios independently. Our results show that NaviSTAR outperforms previous methods with outstanding performance\footnote{The source code and experiment videos of this work are available at: https://sites.google.com/view/san-navistar

翻译：在人类社会中开发用于机器人技术需要保证机器人导航行为的安全性，同时遵守行人的期望和社会规范。然而，在机器人和行人之间保持实时通讯以避免碰撞可能存在困难。为了解决这些挑战，我们提出了一个新颖的社交导航基准，称为NaviSTAR。它利用混合时空图转换(STAR)来理解人密集环境中的交互，融合了潜在群体多模态信息。我们利用离策略强化学习算法和偏好学习来训练一个策略和奖励函数网络，同时加入监督的指导。此外，我们设计了一个社交得分函数来评估社交导航的总体性能。为了比较，我们将我们的算法以及其他最新方法在模拟器和真实场景下独立地进行训练和测试。我们的结果显示，NaviSTAR在表现上优于以前的方法，表现出色。注：本工作的源代码和实验视频可在以下网址找到：https://sites.google.com/view/san-navistar

0

相关内容

偏好学习

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

专知会员服务

58+阅读 · 2023年2月18日

JCIM丨DRlinker：深度强化学习优化片段连接设计

JCIM丨DRlinker：深度强化学习优化片段连接设计

专知会员服务

7+阅读 · 2022年12月9日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知会员服务

37+阅读 · 2022年7月12日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【KDD2021】基于分布式深度强化学习的节能3D车辆众包灾难响应

专知会员服务

13+阅读 · 2021年9月9日

【NUS-Xavier 教授】图神经网络应用概述，15页ppt

专知会员服务

53+阅读 · 2021年6月30日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

专知会员服务

40+阅读 · 2020年3月22日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

166+阅读 · 2020年3月18日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

专知

12+阅读 · 2018年4月26日

【论文推荐】最新7篇视觉问答（VQA）相关论文—解释、读写记忆网络、逆视觉问答、视觉推理、可解释性、注意力机制、计数

【论文推荐】最新7篇视觉问答（VQA）相关论文—解释、读写记忆网络、逆视觉问答、视觉推理、可解释性、注意力机制、计数

专知

30+阅读 · 2018年3月22日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

15+阅读 · 2017年9月24日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

大规模图数据的最大k边连通子图查询处理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的协同目标分割与行为理解研究

国家自然科学基金

0+阅读 · 2013年12月31日

Calderon问题和边界刚性问题

国家自然科学基金

0+阅读 · 2013年12月31日

SAR和可见光图像的脉冲耦合神经网络分层感知融合研究

国家自然科学基金

0+阅读 · 2013年12月31日

绿色建筑系统节能运行自适应动态规划研究

国家自然科学基金

0+阅读 · 2012年12月31日

增强现实装配操作空间的深度感知理论与方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于增强现实的精确截骨手术导航系统

国家自然科学基金

1+阅读 · 2012年12月31日

基于手绘语义地图的室内泛在感知网络下移动机器人视觉交互导航研究

国家自然科学基金

2+阅读 · 2011年12月31日

新型pincer配合物的设计合成及其结构和催化活性研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于动力学分析的Internet网络拥塞控制研究

国家自然科学基金

0+阅读 · 2009年12月31日

Going Incognito in the Metaverse

Arxiv

0+阅读 · 2023年5月30日

Online multiple hypothesis testing for reproducible research

Arxiv

0+阅读 · 2023年5月26日

Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces

Arxiv

0+阅读 · 2023年5月26日

Location-aware Verification for Autonomous Truck Platooning Based on Blockchain and Zero-knowledge Proof

Arxiv

0+阅读 · 2023年5月26日

Spatio-Temporal Transformer-Based Reinforcement Learning for Robot Crowd Navigation

Arxiv

0+阅读 · 2023年5月26日

Multi-behavior Self-supervised Learning for Recommendation

Arxiv

0+阅读 · 2023年5月22日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Learning with Heterogeneous Side Information Fusion for Recommender Systems

Arxiv

10+阅读 · 2018年1月8日

VIP会员

文章信息

相关主题

相关VIP内容

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

【CTH博士论文】基于强化学习的自动驾驶决策，149页pdf

专知会员服务

58+阅读 · 2023年2月18日

JCIM丨DRlinker：深度强化学习优化片段连接设计

JCIM丨DRlinker：深度强化学习优化片段连接设计

专知会员服务

7+阅读 · 2022年12月9日

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

强化学习在机器人中的应用，附视频与Slides，Animesh Garg, UoT

专知会员服务

37+阅读 · 2022年7月12日

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

高效可扩展图神经网络的研究进展，Recent Advances in Efficient and Scalable Graph Neural Networks

专知会员服务

78+阅读 · 2022年3月15日

【KDD2021】基于分布式深度强化学习的节能3D车辆众包灾难响应

专知会员服务

13+阅读 · 2021年9月9日

【NUS-Xavier 教授】图神经网络应用概述，15页ppt

专知会员服务

53+阅读 · 2021年6月30日

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

【CVPR2020】视觉导航的神经拓扑SLAM，Neural Topological SLAM for Visual Navigation

专知会员服务

52+阅读 · 2020年5月26日

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

【WWW2020-UIUC】自动主题分类法构建，Automated Topic Taxonomy Construction

专知会员服务

40+阅读 · 2020年3月22日

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

100+篇《自监督学习(Self-Supervised Learning)》论文最新合集

专知会员服务

166+阅读 · 2020年3月18日

强化学习最新教程，17页pdf

强化学习最新教程，17页pdf

专知会员服务

182+阅读 · 2019年10月11日

热门VIP内容

开通专知VIP会员享更多权益服务

《利用大语言模型（LLM）优化海军陆战队经验教训学习》2025年最新103页

《加拿大陆军顶层作战概念》2025最新33页

超越第一人称视角（FPV）无人机：汲取俄乌战争的全部教训

《瓦洛伦斯（ValoRens）项目 - 预测分析：解读敌方意图》

相关资讯

GNN 新基准！Long Range Graph Benchmark

GNN 新基准！Long Range Graph Benchmark

图与推荐

0+阅读 · 2022年10月18日

VCIP 2022 Call for Demos

VCIP 2022 Call for Demos

CCF多媒体专委会

1+阅读 · 2022年6月6日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

Hierarchically Structured Meta-learning

Hierarchically Structured Meta-learning

CreateAMind

27+阅读 · 2019年5月22日

强化学习的Unsupervised Meta-Learning

强化学习的Unsupervised Meta-Learning

CreateAMind

18+阅读 · 2019年1月7日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

【论文推荐】最新六篇推荐系统相关论文—注意力机制、多任务、协同跨网络、非结构化文本、TransRev、章节推荐

专知

12+阅读 · 2018年4月26日

【论文推荐】最新7篇视觉问答（VQA）相关论文—解释、读写记忆网络、逆视觉问答、视觉推理、可解释性、注意力机制、计数

【论文推荐】最新7篇视觉问答（VQA）相关论文—解释、读写记忆网络、逆视觉问答、视觉推理、可解释性、注意力机制、计数

专知

30+阅读 · 2018年3月22日

【论文】图上的表示学习综述

【论文】图上的表示学习综述

机器学习研究会

15+阅读 · 2017年9月24日

强化学习族谱

强化学习族谱

CreateAMind

26+阅读 · 2017年8月2日

相关论文

Going Incognito in the Metaverse

Arxiv

0+阅读 · 2023年5月30日

Online multiple hypothesis testing for reproducible research

Arxiv

0+阅读 · 2023年5月26日

Chakra: Advancing Performance Benchmarking and Co-design using Standardized Execution Traces

Arxiv

0+阅读 · 2023年5月26日

Location-aware Verification for Autonomous Truck Platooning Based on Blockchain and Zero-knowledge Proof

Arxiv

0+阅读 · 2023年5月26日

Spatio-Temporal Transformer-Based Reinforcement Learning for Robot Crowd Navigation

Arxiv

0+阅读 · 2023年5月26日

Multi-behavior Self-supervised Learning for Recommendation

Arxiv

0+阅读 · 2023年5月22日

Time-Series Event Prediction with Evolutionary State Graph

Arxiv

14+阅读 · 2020年11月25日

Learning to Propagate for Graph Meta-Learning

Arxiv

14+阅读 · 2019年9月11日

Dynamic Graph Neural Networks

Arxiv

24+阅读 · 2018年10月24日

Learning with Heterogeneous Side Information Fusion for Recommender Systems

Arxiv

10+阅读 · 2018年1月8日

相关基金

大规模图数据的最大k边连通子图查询处理研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于深度学习的协同目标分割与行为理解研究

国家自然科学基金

0+阅读 · 2013年12月31日

Calderon问题和边界刚性问题

国家自然科学基金

0+阅读 · 2013年12月31日

SAR和可见光图像的脉冲耦合神经网络分层感知融合研究

国家自然科学基金

0+阅读 · 2013年12月31日

绿色建筑系统节能运行自适应动态规划研究

国家自然科学基金

0+阅读 · 2012年12月31日

增强现实装配操作空间的深度感知理论与方法研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于增强现实的精确截骨手术导航系统

国家自然科学基金

1+阅读 · 2012年12月31日

基于手绘语义地图的室内泛在感知网络下移动机器人视觉交互导航研究

国家自然科学基金

2+阅读 · 2011年12月31日

新型pincer配合物的设计合成及其结构和催化活性研究

国家自然科学基金

0+阅读 · 2009年12月31日

基于动力学分析的Internet网络拥塞控制研究

国家自然科学基金

0+阅读 · 2009年12月31日

微信扫码咨询专知VIP会员