嘉宾:Pieter Abbeel ,加州大学伯克利分校机器人学习实验室主任,人工智能实验室联合主任、covariant.ai 和 Gradescope 联合创始人
在这次演讲中,我将分享我对如何为机器人实现大型预训练神经网络的想法,就像GPT-x/BERT等预训练模型在NLP中被标准使用的方式一样。我列出了我们如何在无监督表征学习、无监督(无奖励)强化学习(RL)预训练、人在循环中的RL和少样本模仿学习等方面取得实质性的研究进展。