在过去的几十年里,人工智能(AI)在“特定能力”(即封闭世界,如人工环境或特定现实任务)上取得了诸多成功。这种定义明确的狭窄能力带来了两个显著优势:一是有清晰的成功标准,二是有机会收集大量示例数据。成功标准不仅可以判断机器是否完成了目标,还能揭示机器未达成目标的具体原因。因此,人类设计者可以逐一修复问题,直到机器在特定任务上表现得足够好。进一步来说,大量收集的示例数据也降低了修复问题的难度(依据中心极限定理)。
那么,封闭世界中的成功能否迁移到广阔的开放世界呢?在开放世界中,机器需要以更少的示例和更少的人类先验知识(如图灵测试所要求)完成任何人类可能执行的任务。答案是否定的。因为在特定任务中获得的能力对处理其他任务几乎没有帮助,针对特定任务制定的有价值标准在面对更广泛、未知的任务时也无能为力。此外,由于在未知任务中缺乏充足的示例数据,中心极限定理无法为我们提供支持。最终,人类设计者也失去了“调试仪”,无法通过不断修补来“破解”开放世界中的 AI 系统。 要实现面向开放世界的 AI,需要不同于构建封闭世界 AI 的独特学习原则和创新技术。本论文探索了构建开放世界 AI 所需的重要学习原则,包括丰富特征(类比为一套庞大的工具箱)、解耦表示(类比为一套井然有序的工具箱)以及推理时学习(类比为一只灵活运用工具的手)。在这些学习原则的指导下,论文进一步提出了利用这些原则的创新方法,并进行了大量大规模实验以验证这些学习原则的有效性。 关键词—— 开放世界 AI、丰富特征、预测性解耦、推理时学习、分布外问题、上下文学习、基于记忆的模型、记忆拼图(v2)。