【AAAI2026】空间操盘手：基于解耦空间表征的鲁棒机器人操作研究 - 专知VIP

会员服务 ·

0

AAAI 2026 · 解耦表征学习 · 机器人 ·

【AAAI2026】空间操盘手：基于解耦空间表征的鲁棒机器人操作研究

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器人操作需要精确的空间理解能力，以实现与真实场景中物体的交互。基于点云的方法受限于稀疏采样，易导致细粒度语义特征丢失；而基于图像的方法通常将RGB和深度信息输入至经3D辅助任务预训练的二维骨干网络，但其纠缠的语义与几何表征对现实场景中固有的深度噪声十分敏感，会严重干扰语义理解。更重要的是，这些方法往往关注高层几何特征，却忽视了实现精准交互所必需的低层空间线索。本文提出解耦式机器人操作框架SpatialActor，通过显式解耦语义与几何表征来解决上述问题。我们设计的语义引导几何模块能够自适应地融合来自噪声深度数据和语义引导专家先验的两种互补几何信息；同时，空间变换器模块充分利用低层空间线索实现精确的2D-3D映射，并促进空间特征间的交互。我们在超过50种模拟与真实场景任务中对SpatialActor进行了全面评估：该框架在RLBench基准测试中以87.4%的准确率刷新了性能记录，在不同噪声环境下仍保持13.9%至19.4%的性能提升，展现出卓越的鲁棒性。此外，该框架显著提升了新任务的少样本泛化能力，并在各类空间扰动下始终保持稳定的操作性能。

项目页面：https://shihao1895.github.io/SpatialActor

成为VIP会员查看完整内容

0

相关内容

AAAI 2026

【CMU博士论文】用于提升含优化层学习的算法与体系结构

【CMU博士论文】用于提升含优化层学习的算法与体系结构

专知会员服务

15+阅读 · 10月7日

【博士论文】面向真实世界场景的基于 Slot 的对象中心表征学习

【博士论文】面向真实世界场景的基于 Slot 的对象中心表征学习

专知会员服务

13+阅读 · 10月4日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

17+阅读 · 5月22日

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

专知会员服务

27+阅读 · 2024年9月29日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知会员服务

40+阅读 · 2022年11月5日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

16+阅读 · 2022年6月4日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知会员服务

43+阅读 · 2022年2月19日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知会员服务

44+阅读 · 2022年1月6日

【ICCV2021】递阶变分神经不确定性模型的随机视频预测

专知会员服务

14+阅读 · 2021年10月9日

[NeurIPS 2020] 球形嵌入的深度度量学习

[NeurIPS 2020] 球形嵌入的深度度量学习

专知会员服务

17+阅读 · 2020年11月8日

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

21+阅读 · 2022年7月16日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

10+阅读 · 2022年4月15日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于虚拟螺旋运动坐标系的捷联速度算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多层平面波分解的快速近远场转换新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于脉冲机动可达域的小行星探测器二维发射窗口研究

国家自然科学基金

0+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于DEM样本的交互式地形合成方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

激光点云数据处理中基于贝叶斯抽样一致性的模型参数稳健估计方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

172+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

222+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

489+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

VIP会员

相关主题

解耦表征学习

相关VIP内容

【CMU博士论文】用于提升含优化层学习的算法与体系结构

【CMU博士论文】用于提升含优化层学习的算法与体系结构

专知会员服务

15+阅读 · 10月7日

【博士论文】面向真实世界场景的基于 Slot 的对象中心表征学习

【博士论文】面向真实世界场景的基于 Slot 的对象中心表征学习

专知会员服务

13+阅读 · 10月4日

《战场GPS拒止环境下基于地标定位的安全路径导航》

《战场GPS拒止环境下基于地标定位的安全路径导航》

专知会员服务

17+阅读 · 5月22日

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

【NeurIPS2024】超越冗余：信息感知的无监督多重图结构学习

专知会员服务

27+阅读 · 2024年9月29日

【NeurIPS 2022】扩散模型的深度平衡方法

【NeurIPS 2022】扩散模型的深度平衡方法

专知会员服务

40+阅读 · 2022年11月5日

【伯克利博士论文】机器人机械搜索的操作与感知策略

【伯克利博士论文】机器人机械搜索的操作与感知策略

专知会员服务

16+阅读 · 2022年6月4日

【ICLR2022】Vision Transformer 模型工作机制的最新理论

【ICLR2022】Vision Transformer 模型工作机制的最新理论

专知会员服务

43+阅读 · 2022年2月19日

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

【AAAI 2022】跨模态目标跟踪: 模态感知表示和统一基准

专知会员服务

44+阅读 · 2022年1月6日

【ICCV2021】递阶变分神经不确定性模型的随机视频预测

专知会员服务

14+阅读 · 2021年10月9日

[NeurIPS 2020] 球形嵌入的深度度量学习

[NeurIPS 2020] 球形嵌入的深度度量学习

专知会员服务

17+阅读 · 2020年11月8日

热门VIP内容

开通专知VIP会员享更多权益服务

【AAAI2026】空间操盘手：基于解耦空间表征的鲁棒机器人操作研究

大型语言模型赋能科研创意生成：创造力导向的研究综述

【博士论文】受脑启发的规划：提升强化学习泛化能力

NeurIPS 2025｜从层次化掩码的视角统一并增强 Graph Transformer

相关资讯

【CVPR2023】探索和利用不确定性的不完整多视角分类

【CVPR2023】探索和利用不确定性的不完整多视角分类

专知

42+阅读 · 2023年4月13日

数据受限条件下的多模态处理技术综述

数据受限条件下的多模态处理技术综述

专知

21+阅读 · 2022年7月16日

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

【ICLR2022】图神经网络复杂时间序列建模以及医疗健康应用

专知

10+阅读 · 2022年4月15日

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

【AAAI2021】知识图谱增强的预训练模型的生成式常识推理

专知

29+阅读 · 2021年1月25日

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

【KDD2020-Tutorial】因果推理与稳定学习，Causal Inference and Stable Learning

专知

11+阅读 · 2020年8月28日

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

【CVPR2020-清华大学】渐进对抗网络的细粒度域适应，Progressive Adversarial Networks

专知

31+阅读 · 2020年4月4日

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

图卷积神经网络蒸馏知识，Distillating Knowledge from GCN

专知

41+阅读 · 2020年3月25日

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

【学界】CVPR 2019 | 基于级联语义引导下的多通道注意力选择图像翻译

GAN生成式对抗网络

10+阅读 · 2019年8月17日

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

论文浅尝 | 当知识图谱遇上零样本学习——零样本学习综述

开放知识图谱

20+阅读 · 2018年9月26日

深度学习时代的目标检测算法

深度学习时代的目标检测算法

炼数成金订阅号

40+阅读 · 2018年3月19日

相关基金

间接优化的高效Monte Carlo声传播研究

国家自然科学基金

0+阅读 · 2017年12月31日

基于进化算法的大规模本体匹配问题研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于虚拟螺旋运动坐标系的捷联速度算法研究

国家自然科学基金

0+阅读 · 2015年12月31日

视觉识别中的实用鲁棒回归技术研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于多层平面波分解的快速近远场转换新方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于低秩表示的鲁棒特征抽取和分类方法研究

国家自然科学基金

3+阅读 · 2015年12月31日

基于脉冲机动可达域的小行星探测器二维发射窗口研究

国家自然科学基金

0+阅读 · 2015年12月31日

Semi-Markovian跳跃系统的分析、控制综合与状态估计研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于DEM样本的交互式地形合成方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

激光点云数据处理中基于贝叶斯抽样一致性的模型参数稳健估计方法研究

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

172+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Comprehensive Survey on Deep Graph Representation Learning

Arxiv

106+阅读 · 2023年4月11日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

222+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

489+阅读 · 2023年3月31日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

81+阅读 · 2023年3月26日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Hyper-SAGNN: a self-attention based graph neural network for hypergraphs

Arxiv

17+阅读 · 2019年11月6日

微信扫码咨询专知VIP会员