嘉宾:Pieter Abbeel ,加州大学伯克利分校机器人学习实验室主任,人工智能实验室联合主任、covariant.ai 和 Gradescope 联合创始人

在这次演讲中,我将分享我对如何为机器人实现大型预训练神经网络的想法,就像GPT-x/BERT等预训练模型在NLP中被标准使用的方式一样。我列出了我们如何在无监督表征学习、无监督(无奖励)强化学习(RL)预训练、人在循环中的RL和少样本模仿学习等方面取得实质性的研究进展。

成为VIP会员查看完整内容
28

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
93+阅读 · 2021年7月2日
UC伯克利Pieter Abbeel谈论强化学习-视频
专知
7+阅读 · 2018年12月17日
Arxiv
8+阅读 · 2021年5月20日
Arxiv
3+阅读 · 2018年1月31日
Arxiv
3+阅读 · 2017年7月6日
VIP会员
相关VIP内容
【DeepMind】多模态预训练模型概述,37页ppt
专知会员服务
93+阅读 · 2021年7月2日
微信扫码咨询专知VIP会员