一看就会!英伟达新研究教机器人仅通过观察人类行为完成任务

2018 年 5 月 23 日 新智元





  新智元编译  

来源:news.developer.nvidia.com

翻译:肖琴


【新智元导读】NVIDIA的研究人员开发了第一个可以教机器人仅通过观察人类的行为来完成任务的深度学习系统。该方法利用合成数据来训练神经网络,是第一次在机器人上使用以图像为中心的域随机化方法。


论文地址:https://arxiv.org/abs/1805.07054



来自NVIDIA的研究人员开发了一个基于深度学习的系统,该系统可以教机器人仅通过观察人类的行为来完成任务。该方法旨在加强人与机器人之间的交流,同时进一步研究如何使人类无缝地与机器人一起工作。这是第一个这样的系统,研究由Stan Birchfield和Jonathan Tremblay领导。


“要想让机器人在现实世界中执行有用的任务,必须要能很容易地将任务传达给机器人。这包括预期的结果以及任何关于达到该结果的最佳方法的提示。”研究人员在他们的研究报告中指出。“通过演示,用户可以将任务传达给机器人,并向机器人提供如何以最佳的方式执行任务的线索。


研究人员使用NVIDIA TITAN X GPU训练了一系列神经网络来执行与感知、程序生成和程序执行相关的任务。结果显示,机器人能够通过观察现实世界的单个演示来学习任务


该方法的工作方式:一个摄像机被用来捕获场景的实时视频流,并且通过两个神经网络实时地对场景中对象的位置和关系进行推断。由此产生的知觉被输入到另一个网络中,该网络生成一个解释如何重建这些感知的计划。 最后,一个执行网络读取该计划并为机器人生成动作,同时考虑到当前场景的状态,以确保对外部干扰的稳健性。


一旦机器人得到一个任务,它就会生成一个人类可读取的关于重新执行该任务所需步骤的描述。该描述让用户能够在机器人执行之前快速识别和纠正机器人对人类演示的解释中的问题。


实现这种能力的关键是利用合成数据来训练神经网络。目前训练神经网络的方法需要大量有标记的训练数据,这对这类系统来说是一个瓶颈。通过合成数据生成,不用太费力就可以生成几乎无限的标记训练数据。


这也是第一次在机器人上使用以图像为中心的域随机化方法。域随机化(domain randomization)是一种产生大量多样性的合成数据的技术,然后愚弄感知网络将真实世界的数据看作是其训练数据的另一种变体。研究人员选择以图像为中心的方式处理数据,以确保网络不依赖于摄像机或环境。


研究人员说:“如描述所示,这个感知网络适用于任何固态的现实世界物体,这些物体可以通过其3D边界立方体(bounding cuboid)来模拟。”“尽管训练过程中从未观察到真实的图像,但感知网络能够在真实图像中可靠地检测到物体的bounding cuboid,即使在有严重的遮挡的情况下也是如此。”


在他们的演示中,研究团队用几个彩色积木和一辆玩具汽车训练目标检测器。系统被教授“块”(blocks)的物理关系,不管这些“块”是堆叠在一起还是彼此相邻放置。

 


在上面的演示视频中,人类操作员向机器人展示了一组立方块。系统然后推断一个适当的程序并按正确的顺序将立方块正确地放置好。因为它在执行过程中会考虑当前世界的状态,因此系统能够实时地从错误中恢复过来。


研究人员将在本周于澳大利亚布里斯班举行的机器人与自动化国际会议(ICRA)上发表他们的研究论文和工作。


该团队表示,他们将继续探索使用合成训练数据进行机器人操纵,以将他们的方法扩展到其他场景。


论文地址:https://arxiv.org/abs/1805.07054




【加入社群】


新智元 AI 技术 + 产业社群招募中,欢迎对 AI 技术 + 产业落地感兴趣的同学,加小助手微信号: aiera2015_3  入群;通过审核后我们将邀请进群,加入社群后务必修改群备注(姓名 - 公司 - 职位;专业群审核较严,敬请谅解)。


登录查看更多
0

相关内容

NVIDIA(全称NVIDIA Corporation,NASDAQ:NVDA,发音:IPA:/ɛnvɪdɪə/,台湾官方中文名为輝達),创立于1993年4月,是一家以设计显示芯片和芯片组为主的半导体公司。NVIDIA亦会设计游戏机核心,例如Xbox和PlayStation 3。NVIDIA最出名的产品线是为个人与游戏玩家所设计的GeForce系列,为专业工作站而设计的Quadro系列,以及为服务器和高效运算而设计的Tesla系列。 NVIDIA的总部设在美国加利福尼亚州的圣克拉拉。是一家无晶圆(Fabless)IC半导体设计公司。"NVIDIA"的读音与英文"video"相似,亦与西班牙文evidia(英文"envy")相似。现任总裁为黄仁勋。
【WWW2020-微软】理解用户行为用于文档推荐
专知会员服务
36+阅读 · 2020年4月5日
【斯坦福&Google】面向机器人的机器学习,63页PPT
专知会员服务
26+阅读 · 2019年11月19日
【自监督学习】OpenAI科学家一文详解自监督学习
产业智能官
25+阅读 · 2020年3月18日
使用强化学习训练机械臂完成人类任务
AI研习社
13+阅读 · 2019年3月23日
一个神经网络实现4大图像任务,GitHub已开源
新任务&数据集:视觉常识推理(VCR)
专知
50+阅读 · 2018年12月1日
Arxiv
3+阅读 · 2018年11月13日
Arxiv
7+阅读 · 2018年6月1日
Arxiv
3+阅读 · 2018年5月28日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员