谷歌大脑提出TCN，能让机器人边看视频边模仿 - 专知

会员服务 ·

0

谷歌大脑提出TCN，能让机器人边看视频边模仿

2018 年 2 月 7 日 AI研习社 雷锋字幕组

▷谷歌大脑 Time-Contrastive Networks（TCN）论文解读视频

翻译 | Laura 校对 | 吴璇整理 | 凡江

在「Time-Contrastive Networks: Self-Supervised Learning from Multi-View Observation」这篇论文中，谷歌的研究者提出了一种从观察中学习世界的新方法。雷锋字幕组本期译制视频多角度展示了机器人仅仅通过观看视频，就能在无人监督的情况下，模拟视频动作的全过程。

除了视频演示之外，谷歌大脑并未对机器人系统提供监督学习。他们将这种方法运用于各种不同的任务，以此来训练真实和虚拟机器人。例如，倒水任务，放碟任务，和姿势模仿任务。

第一步

通过视频的分解镜头来学习，将时间作为监督信号，发现视频的不同属性。这组嵌入向量经由一组非结构化和未标记的视频训练，里面含有和任务相关的有效动作，也有一些随机行为，来体现真实世界中的各种可能状态。

模型使用triplet loss误差函数，基于同一帧的多视角观察数据来训练多视角下同时出现的帧，在嵌入空间中互相关联。当然也可以考虑一个时间对比模型，只根据单一视角来训练。这一次，有效帧在锚点的一定范围内随机选定，根据有效范围计算边际范围。无效范围是在边际范围外随机选定。模型和之前一样进行训练。

第二步

通过强化学习来学习规则。基于TCN嵌入，根据第三方的真人示范来构造奖励函数。机械臂起初尝试一些随机动作，然后学会反复进行这些动作，就可以产生最高奖励的控制步骤，最后达成重现视频任务的效果。

模型在仅仅经历了9次迭代后就成功收敛，大约相当于现实世界15分钟的训练。同样地，在移碟任务中，机器人最初尝试随机运动，然后学会成功拿起和移动一个盘子。

论文原址：

https://sermanet.github.io/tcn/

相关文章：

看一遍人类动作就能模仿，能理解语义的谷歌机器人登上无监督学习的新高度

新人福利

关注 AI 研习社（okweiwu），回复 1 领取

【超过 1000G 神经网络 / AI / 大数据，教程，论文】

谷歌大脑让机器尝试画画，虽然结果很勉强但过程你却不能不知道

▼▼▼

登录查看更多

3

相关内容

TCN

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【论文】欺骗学习（Learning by Cheating）

【论文】欺骗学习（Learning by Cheating）

专知会员服务

28+阅读 · 2020年1月3日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

最新415页《人工智能与机器人原理》（Principles of Robotics & Artificial Intelligence）书籍

最新415页《人工智能与机器人原理》（Principles of Robotics & Artificial Intelligence）书籍

专知会员服务

55+阅读 · 2019年10月27日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

让机器人看一眼就能模仿：One-Shot模仿学习发展情况

让机器人看一眼就能模仿：One-Shot模仿学习发展情况

机器之心

7+阅读 · 2019年9月23日

已删除

将门创投

11+阅读 · 2019年8月13日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

AI科技评论

7+阅读 · 2019年6月17日

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

机器人大讲堂

3+阅读 · 2019年2月2日

6D目标姿态估计，李飞飞夫妇等提出DenseFusion

6D目标姿态估计，李飞飞夫妇等提出DenseFusion

机器之心

9+阅读 · 2019年1月17日

Grasp2Vec：通过自我监督式抓取学习物体表征

Grasp2Vec：通过自我监督式抓取学习物体表征

谷歌开发者

9+阅读 · 2019年1月2日

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

GAN生成式对抗网络

7+阅读 · 2018年5月26日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

机器之心

5+阅读 · 2018年4月4日

A Survey on Edge Intelligence

A Survey on Edge Intelligence

Arxiv

52+阅读 · 2020年3月26日

Learning by Abstraction: The Neural State Machine

Learning by Abstraction: The Neural State Machine

Arxiv

6+阅读 · 2019年7月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Learning to Sketch with Shortcut Cycle Consistency

Arxiv

5+阅读 · 2018年5月1日

The Best of Both Worlds: Combining Recent Advances in Neural Machine Translation

Arxiv

4+阅读 · 2018年4月26日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Analyzing Uncertainty in Neural Machine Translation

Arxiv

6+阅读 · 2018年2月28日

Face Synthesis from Visual Attributes via Sketch using Conditional VAEs and GANs

Arxiv

4+阅读 · 2017年12月30日

VIP会员

相关主题

相关VIP内容

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

【CVPR2020-Facebook AI】单样本自适应域脸生成，One-Shot Domain Adaptation

专知会员服务

29+阅读 · 2020年4月6日

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

【CVPR2020-斯坦福】从RGB-D扫描对抗纹理优化，Adversarial Texture Optimization

专知会员服务

17+阅读 · 2020年3月21日

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

Nature论文：用于自主血管通路的深度学习机器人导航，新泽西州立大学

专知会员服务

24+阅读 · 2020年2月17日

【论文】欺骗学习（Learning by Cheating）

【论文】欺骗学习（Learning by Cheating）

专知会员服务

28+阅读 · 2020年1月3日

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

论深度学习的信息瓶颈理论（On the information bottleneck theory of deep learning）

专知会员服务

66+阅读 · 2019年12月20日

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

【NeurIPS2019演讲】伯克利Pieter Abbeel，通过元强化学习实现更好的基于模型的RL(Better Model-based RL through Meta RL)

专知会员服务

33+阅读 · 2019年12月13日

【斯坦福&Google】面向机器人的机器学习，63页PPT

【斯坦福&Google】面向机器人的机器学习，63页PPT

专知会员服务

26+阅读 · 2019年11月19日

最新415页《人工智能与机器人原理》（Principles of Robotics & Artificial Intelligence）书籍

最新415页《人工智能与机器人原理》（Principles of Robotics & Artificial Intelligence）书籍

专知会员服务

55+阅读 · 2019年10月27日

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

【斯坦福大学李飞飞高徒朱玉可博士毕业论文和PPT，158页pdf与96页slides】闭合感知-动作循环:实现通用机器人的自治，能够理解并与现实世界交互的通用机器人构建智能

专知会员服务

104+阅读 · 2019年10月22日

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

【Pieter Abbeel 报告@CMU】元学习与深度强化学习机器人应用，Deep Learning to Learn，84页ppt

专知会员服务

32+阅读 · 2019年10月12日

热门VIP内容

开通专知VIP会员享更多权益服务

《使用量化测量将传感器节点关联到融合中心的算法设计》171页

军事前沿模型

提升军事训练能力的最佳人工智能模拟工具

《社交媒体信息作战》最新48页技术报告

相关资讯

让机器人看一眼就能模仿：One-Shot模仿学习发展情况

让机器人看一眼就能模仿：One-Shot模仿学习发展情况

机器之心

7+阅读 · 2019年9月23日

已删除

将门创投

11+阅读 · 2019年8月13日

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

【前沿】让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

中国自动化学会

11+阅读 · 2019年6月18日

让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

让机器像人类一样学习? 伯克利 AI 研究院提出新的元强化学习算法！

AI科技评论

7+阅读 · 2019年6月17日

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

前沿|机器人真的有意识了！突破狭义AI的自我学习机器人问世

机器人大讲堂

3+阅读 · 2019年2月2日

6D目标姿态估计，李飞飞夫妇等提出DenseFusion

6D目标姿态估计，李飞飞夫妇等提出DenseFusion

机器之心

9+阅读 · 2019年1月17日

Grasp2Vec：通过自我监督式抓取学习物体表征

Grasp2Vec：通过自我监督式抓取学习物体表征

谷歌开发者

9+阅读 · 2019年1月2日

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

【深度】Google提出「自监督」表征学习方法，让智能体通过「观察」认识世界

GAN生成式对抗网络

7+阅读 · 2018年5月26日

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

不用地图如何导航？DeepMind提出新型双路径强化学习「智能体」架构

极市平台

3+阅读 · 2018年4月11日

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

前沿 | 没有地图也能导航：DeepMind展示全新AI导航技术

机器之心

5+阅读 · 2018年4月4日

相关论文

A Survey on Edge Intelligence

A Survey on Edge Intelligence

Arxiv

52+阅读 · 2020年3月26日

Learning by Abstraction: The Neural State Machine

Learning by Abstraction: The Neural State Machine

Arxiv

6+阅读 · 2019年7月11日

Cross-lingual Knowledge Graph Alignment via Graph Matching Neural Network

Arxiv

15+阅读 · 2019年5月28日

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Generalizing Across Multi-Objective Reward Functions in Deep Reinforcement Learning

Arxiv

5+阅读 · 2018年9月17日

Scaling Neural Machine Translation

Arxiv

3+阅读 · 2018年6月1日

Learning to Sketch with Shortcut Cycle Consistency

Arxiv

5+阅读 · 2018年5月1日

The Best of Both Worlds: Combining Recent Advances in Neural Machine Translation

Arxiv

4+阅读 · 2018年4月26日

Phrase-Based & Neural Unsupervised Machine Translation

Arxiv

4+阅读 · 2018年4月20日

Analyzing Uncertainty in Neural Machine Translation

Arxiv

6+阅读 · 2018年2月28日

Face Synthesis from Visual Attributes via Sketch using Conditional VAEs and GANs

Arxiv

4+阅读 · 2017年12月30日

大家都在搜

国防科技创新

大型语言模型

久别重逢话双塔

无人机测控通信自组网技术综述

微信扫码咨询专知VIP会员