会员服务 ·

这个机器人不学数据集，“纯玩”get各类家务技能，LeCun觉得很赞

2018 年 12 月 3 日 量子位

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI

伯克利的研究人员最近利用视觉模型强化学习训练了一个不一样的机器人，能够通过自己的探索，完成各种任务：整理玩具、叠衣服、收拾餐具……

并且，这样一个多功能机器人的训练过程是无监督的，不需要投喂数据，完全是机器人自行摸索后学到的。

也就是说，这个机器人看了看你杂乱的房间，就自主的收拾了起来。

帮你把乱放的苹果放进盘子：

帮你叠起秋衣：

整理玩具：

咦，二胡卵子误入。

完成这一系列工作的，都是同一套算法。

这些神奇的技能，Yann LeCun看到都惊呼：Awesome！

像小朋友一样摸索世界

我们开头说过，这个机器人不需要人为投喂数据。

那么数据从哪儿来呢？从需要它工作的现实世界来。

在一个摆放了各种物体的“房间”内，可以让机器人自由摸索，感受房间里的一切，在无监督的情况下，机器人完全可以自己玩自己的。

除了玩杯子、玩具这些硬的东西，还可以玩“软体”的毛巾：

玩的过程中，机器人就通过各种传感器，学到了视觉能力，知道自己身边是什么东西；

学到了定位能力，知道自己在做什么；

学到了做不同的动作，知道自己发出不同命令后，手臂会做什么；

学会熟练使用自己的“手”，可以预测到手做什么动作会对环境中的物体产生怎样的影响。

整个探索过程没有分数、不设输赢，完全是机器人自己凭借“好奇心”，通过摸索这个房间里的物品，形成自己的一套“世界观”的过程。

派活就行，不用你教怎么干

当机器人已经对环境中的物体了如指掌之后，我们该怎么给它安排工作呢？

用像素点。

在整个环境中，通过像素点给机器人标注任务目标，红色为起始点，绿色为结束点，也就是告诉机器人把红点位置的东西搬到绿点位置。

机器人，你来把红点位置的苹果，挪到绿点位置的盘子上去。

机器人想了想，大概只要把苹果夹起来，把手臂挪过去，把苹果放下，就可以了把？

△ 机器人内心的“草稿”

那就这么办了，召唤机械臂，是骡子是马，我们挪一个看看。

Bingo！成功。

下一个任务，我们把牛仔热裤叠起来。

想一想，揪住一个角，挪过来就好了吧？

根据这个计划试一试：

完美成功~

这个过程具体是怎样的呢？伯克利官方给出了一个视频，可以打开学习一下：

传送门

最后，照例附上传送门。

论文：

Visual Foresight: Model-Based Deep Reinforcement Learning for Vision-Based Robotic Control
Frederik Ebert, Chelsea Finn, Sudeep Dasari, Annie Xie, Alex Lee, Sergey Levine
https://drive.google.com/file/d/1scfbONOHg8H2_pJ9naRkHfk4dGSNGNWO/view

博客：

Visual Model-Based Reinforcement Learning as a Path towards Generalist Robots
https://bair.berkeley.edu/blog/2018/11/30/visual-rl/

至于开源代码嘛，官方表示coming soon，或许过一段时间能在这个页面里找到：
https://sites.google.com/view/visualforesight

— 完 —

年度评选申请

加入社群

量子位AI社群开始招募啦，欢迎对AI感兴趣的同学，在量子位公众号（QbitAI）对话界面回复关键字“交流群”，获取入群方式；

此外，量子位专业细分群(自动驾驶、CV、NLP、机器学习等)正在招募，面向正在从事相关领域的工程师及研究人员。

进专业群请在量子位公众号（QbitAI）对话界面回复关键字“专业群”，获取入群方式。（专业群审核较严，敬请谅解）

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

【Manning书籍】像数据科学家一样思考，331页pdf教您如何步步成为数据科学家

专知会员服务

49+阅读 · 2020年6月18日

史上机器学习 &深度学习课程大合集，一站搞定，Deep Learning Drizzle

专知会员服务

176+阅读 · 2020年5月10日

【经典】《上海交通大学生存手册》，一本让你在大学活出精彩的秘籍

专知会员服务

203+阅读 · 2020年4月18日

【论文】欺骗学习（Learning by Cheating）

专知会员服务

28+阅读 · 2020年1月3日

吴恩达新书《Machine Learning Yearning》完整中文版

专知会员服务

147+阅读 · 2019年10月27日

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

机器人大讲堂

3+阅读 · 2019年2月2日

斯坦福机器人制造者吴恩达：生活中的机器人，将是专用机器人

机器之能

4+阅读 · 2019年1月22日

从零开始一起学习SLAM | SLAM有什么用？

计算机视觉life

18+阅读 · 2018年9月17日

谷歌大脑QT-Opt算法，机器人探囊取物成功率96%，Jeff Dean大赞

量子位

4+阅读 · 2018年6月29日

这个高仿真框架AI2-THOR，想让让强化学习快速走进现实世界

量子位

6+阅读 · 2017年12月16日

Multi-class Classification without Multi-class Labels

Arxiv

4+阅读 · 2019年1月2日

Meta-Learning: A Survey

Arxiv

136+阅读 · 2018年10月8日

Fine-tuning CNN Image Retrieval with No Human Annotation

Arxiv

4+阅读 · 2018年7月10日

Planar Object Tracking in the Wild: A Benchmark

Arxiv

5+阅读 · 2018年5月22日

Semantic Binary Segmentation using Convolutional Networks without Decoders

Arxiv

8+阅读 · 2018年5月1日

VIP会员

这个机器人不学数据集，“纯玩”get各类家务技能，LeCun觉得很赞

郭一璞 发自 凹非寺 量子位 报道 | 公众号 QbitAI

像小朋友一样摸索世界

派活就行，不用你教怎么干

△ 机器人内心的“草稿”

传送门

相关内容

知识荟萃

更多

郭一璞发自凹非寺
量子位报道 | 公众号 QbitAI