人形机器人是机器人技术的集大成者, 在服务国家重大战略需求中扮演着重要的角色, 可以协 助或取代人在危险、肮脏和重复的环境中, 执行各种类型的任务. 本文以人工智能 (artificial intelligence, AI) 大模型驱动的具身智能人形机器人技术与展望为切入口, 系统介绍人形机器人的发展背景与意义, 重点阐述大模型技术, 如大型自然语言模型、视觉 Transformer、视觉语言模型、视觉生成模型、具身 多模态大模型等, 并从分布式模块化大模型技术、端到端一体化大模型技术、云边端协同化大模型技 术等 3 个方面, 详细介绍 AI 大模型驱动的具身智能人形机器人关键技术. 具身智能人形机器人的应 用场景十分广泛, 而大模型技术的发展为机器人感知识别、认知决策、规划调度、行为控制注入语言 理解、视觉泛化、常识推理等关键能力, 进一步推动人形机器人在智能制造、国防安全等领域的应用. 最后本文探讨了大模型驱动的具身智能人形机器人的技术挑战与展望. 关键词 人形机器人, 具身智能, 自然语言大模型, 视觉语言大模型, 具身多模态大模型