这个机器人不学数据集,“纯玩”get各类家务技能,LeCun觉得很赞

2018 年 12 月 3 日 量子位
郭一璞 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

伯克利的研究人员最近利用视觉模型强化学习训练了一个不一样的机器人,能够通过自己的探索,完成各种任务:整理玩具、叠衣服、收拾餐具……

并且,这样一个多功能机器人的训练过程是无监督的,不需要投喂数据,完全是机器人自行摸索后学到的。

也就是说,这个机器人看了看你杂乱的房间,就自主的收拾了起来。

帮你把乱放的苹果放进盘子:

帮你叠起秋衣:

整理玩具:

咦,二胡卵子误入。

完成这一系列工作的,都是同一套算法。

这些神奇的技能,Yann LeCun看到都惊呼:Awesome!

像小朋友一样摸索世界

我们开头说过,这个机器人不需要人为投喂数据。

那么数据从哪儿来呢?从需要它工作的现实世界来。

在一个摆放了各种物体的“房间”内,可以让机器人自由摸索,感受房间里的一切,在无监督的情况下,机器人完全可以自己玩自己的。

除了玩杯子、玩具这些硬的东西,还可以玩“软体”的毛巾:

玩的过程中,机器人就通过各种传感器,学到了视觉能力,知道自己身边是什么东西;

学到了定位能力,知道自己在做什么;

学到了做不同的动作,知道自己发出不同命令后,手臂会做什么;

学会熟练使用自己的“手”,可以预测到手做什么动作会对环境中的物体产生怎样的影响。

整个探索过程没有分数、不设输赢,完全是机器人自己凭借“好奇心”,通过摸索这个房间里的物品,形成自己的一套“世界观”的过程。

派活就行,不用你教怎么干

当机器人已经对环境中的物体了如指掌之后,我们该怎么给它安排工作呢?

用像素点。

在整个环境中,通过像素点给机器人标注任务目标,红色为起始点,绿色为结束点,也就是告诉机器人把红点位置的东西搬到绿点位置。

机器人,你来把红点位置的苹果,挪到绿点位置的盘子上去。

机器人想了想,大概只要把苹果夹起来,把手臂挪过去,把苹果放下,就可以了把?

 机器人内心的“草稿”

那就这么办了,召唤机械臂,是骡子是马,我们挪一个看看。

Bingo!成功。

下一个任务,我们把牛仔热裤叠起来。

想一想,揪住一个角,挪过来就好了吧?

根据这个计划试一试:

完美成功~

这个过程具体是怎样的呢?伯克利官方给出了一个视频,可以打开学习一下:

传送门

最后,照例附上传送门。

论文:

Visual Foresight: Model-Based Deep Reinforcement Learning for Vision-Based Robotic Control
Frederik Ebert, Chelsea Finn, Sudeep Dasari, Annie Xie, Alex Lee, Sergey Levine
https://drive.google.com/file/d/1scfbONOHg8H2_pJ9naRkHfk4dGSNGNWO/view

博客:

Visual Model-Based Reinforcement Learning as a Path towards Generalist Robots
https://bair.berkeley.edu/blog/2018/11/30/visual-rl/

至于开源代码嘛,官方表示coming soon,或许过一段时间能在这个页面里找到:
https://sites.google.com/view/visualforesight

年度评选申请

加入社群

量子位AI社群开始招募啦,欢迎对AI感兴趣的同学,在量子位公众号(QbitAI)对话界面回复关键字“交流群”,获取入群方式;


此外,量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募,面向正在从事相关领域的工程师及研究人员。


进专业群请在量子位公众号(QbitAI)对话界面回复关键字“专业群”,获取入群方式。(专业群审核较严,敬请谅解)

诚挚招聘

量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态


登录查看更多
0

相关内容

机器人(英语:Robot)包括一切模拟人类行为或思想与模拟其他生物的机械(如机器狗,机器猫等)。狭义上对机器人的定义还有很多分类法及争议,有些电脑程序甚至也被称为机器人。在当代工业中,机器人指能自动运行任务的人造机器设备,用以取代或协助人类工作,一般会是机电设备,由计算机程序或是电子电路控制。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
109+阅读 · 2020年3月12日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
吴恩达新书《Machine Learning Yearning》完整中文版
专知会员服务
145+阅读 · 2019年10月27日
为什么所有人都报了这个虐人到哭的NLP训练营?
深度学习与NLP
26+阅读 · 2019年5月15日
为什么所有人都报了这个虐人到哭的训练营?!
人工智能头条
5+阅读 · 2019年5月15日
吴恩达“官宣”荣升准爸爸~
AI100
4+阅读 · 2019年1月18日
从零开始一起学习SLAM | SLAM有什么用?
计算机视觉life
18+阅读 · 2018年9月17日
Arxiv
136+阅读 · 2018年10月8日
Arxiv
8+阅读 · 2018年7月12日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
5+阅读 · 2018年5月22日
VIP会员
相关VIP内容
专知会员服务
109+阅读 · 2020年3月12日
【Google AI】开源NoisyStudent:自监督图像分类
专知会员服务
54+阅读 · 2020年2月18日
【论文】欺骗学习(Learning by Cheating)
专知会员服务
26+阅读 · 2020年1月3日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
25+阅读 · 2019年11月19日
吴恩达新书《Machine Learning Yearning》完整中文版
专知会员服务
145+阅读 · 2019年10月27日
相关论文
Arxiv
136+阅读 · 2018年10月8日
Arxiv
8+阅读 · 2018年7月12日
Arxiv
11+阅读 · 2018年7月8日
Arxiv
5+阅读 · 2018年5月22日
Top
微信扫码咨询专知VIP会员