Agile human-centric manufacturing increasingly requires resilient robotic solutions that are capable of safe and productive interactions within unstructured environments of modern factories. While multi-modal sensor fusion provides comprehensive situational awareness yet robots must also contextualize their reasoning to achieve deep semantic understanding of complex scenes. Foundation model particularly Vision-Language-Action (VLA) models have emerged as promising approach on integrating diverse perceptual modalities and spatio-temporal reasoning abilities to ground physical actions to realize General Physical Intelligence (GPI) across various robotic embodiments. Although GPI has been conceptually discussed in literature but its pivotal role and practical deployment in agile manufacturing remain underexplored. To address this gap, this practical review systematically surveys recent advances in VLA models through the lens of GPI by offering comparative analysis of leading implementations and evaluating their industrial readiness via structured ablation study. The state of the art is organized into six thematic pillars including multisensory representation learning, sim2real transfer, planning and control, uncertainty and safety measures and benchmarking. Finally, the review highlights open challenges and future directions for integrating GPI into industrial ecosystems to align with the vision of Industry 5.0 for intelligent, adaptive and collaborative manufacturing ecosystem.


翻译:敏捷的以人为中心的制造日益需要具备弹性的机器人解决方案,这些方案能够在现代工厂的非结构化环境中实现安全且高效的人机交互。虽然多模态传感器融合提供了全面的态势感知,但机器人还必须将其推理过程情境化,以实现对复杂场景的深层语义理解。基础模型,特别是视觉-语言-动作模型,已成为一种有前景的方法,它通过整合多样化的感知模态与时空推理能力,将物理动作与现实世界关联起来,从而在不同机器人实体中实现通用物理智能。尽管通用物理智能在文献中已有概念性讨论,但其在敏捷制造中的关键作用与实际部署仍未被充分探索。为填补这一空白,本实用综述通过通用物理智能的视角,系统性地梳理了视觉-语言-动作模型的最新进展,通过对领先实施方案的比较分析,以及通过结构化消融研究评估其工业就绪度,将当前最先进的技术组织为六大主题支柱,包括多感官表征学习、仿真到现实迁移、规划与控制、不确定性与安全措施以及基准测试。最后,本文强调了将通用物理智能整合到工业生态系统中所面临的开放挑战与未来方向,以期与工业5.0所倡导的智能、自适应和协作制造生态系统的愿景保持一致。

0
下载
关闭预览

相关内容

论文浅尝 | GEOM-GCN: Geometric Graph Convolutional Networks
开放知识图谱
14+阅读 · 2020年4月8日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
16+阅读 · 2013年12月31日
Top
微信扫码咨询专知VIP会员