人工智能系统近年来已经展现出了显著的进步。然而,扩展性和泛化到实际问题仍然是一个重大问题。在本论文中,我们探讨了构建可扩展计算机视觉人工智能系统的三个关键组成部分,包括模型优化能力、学习目标和大规模数据集,并将这些成果应用于机器人技术。我们的工作从视觉变换器的优化性研究开始,提出了一组新的优化性度量标准和一种替代的片段化设计。接下来,我们引入了一种对比自监督学习目标,减少了自监督学习中的归纳偏见,导致在各种数据集上都有优越的性能。然后,我们展示了自监督视觉预训练在真实世界图像中学习运动控制任务的效果,从像素中学习,超越了有监督的基线,并与标准状态性能相匹配。在此基础上,我们探索了在野外多样化视频中对真实世界机器人任务的自监督视觉预训练,展示了预训练表示在一系列任务和实体中的有效性。此外,我们提出了一种基于因果变换器的仿真到真实学习方法,用于真实世界中全尺寸仿人机器人的行走,这标志着第一个完全基于学习的方法用于真实世界中全尺寸仿人机器人的行走。最后,我们总结了论文并讨论了该领域进一步研究的可能未来方向。

成为VIP会员查看完整内容
31

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】开放环境视频中的多人三维重建,184页pdf
专知会员服务
32+阅读 · 2023年10月11日
【伯克利博士论文】可迁移生成模型,137页pdf
专知会员服务
53+阅读 · 2023年5月23日
【伯克利博士论文】数据与标签高效表示学习,114页pdf
专知会员服务
51+阅读 · 2023年2月20日
专知会员服务
71+阅读 · 2021年7月29日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
Arxiv
153+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
395+阅读 · 2023年3月31日
Arxiv
65+阅读 · 2023年3月26日
Arxiv
137+阅读 · 2023年3月24日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
45+阅读 · 2009年12月31日
微信扫码咨询专知VIP会员