近年来,我们已经看到了预训练神经网络来学习可迁移到视觉和NLP中看不见的下游任务的表征的巨大好处。然而,这种学习范式在诸如设计优化或控制等决策方面的研究还不多。在这篇论文中,我们概述了两个问题设置,可以受益于在决策制定的背景下的预训练。首先,我们描述了一个用于自动化设计优化的设置,特别是电路设计优化,在该设置中,特定领域的先验数据可以有效地提高基于模型的优化方法的样本效率。本文对如何提高基于模型的进化算法和贝叶斯优化方法的样本效率提出了新的思路,并进行了实证和理论分析。在第二个问题设置中,我们将讨论如何从大型任务无关数据集中利用无监督的预训练来提取行为表征,并进行少量的模仿学习。我们发现,当新任务的例子演示稀缺时,预训练agent提取技能是使他们准备进行少样本模仿的一个实用方向。

https://www2.eecs.berkeley.edu/Pubs/TechRpts/2022/EECS-2022-35.html

成为VIP会员查看完整内容
20

相关内容

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下,选择自己能够把握和驾驭的潜在的研究方向,开辟新的研究领域。由此可见,这就对作者提出了较高要求,它要求作者必须在本学科的专业领域具备大量的理论知识,并对所学专业的理论知识有相当深入的理解和思考,同时还要具有相当水平的独立科学研究能力,能够为在学科领域提出独创性的见解和有价值的科研成果。因而,较之学士论文、硕士论文,博士论文具有更高的学术价值,对学科的发展具有重要的推动作用。
【CMU博士论文】通过记忆的元强化学习,118页pdf
专知会员服务
46+阅读 · 2022年6月23日
【ICML2022】深度潜在粒子的无监督图像表示学习
专知会员服务
7+阅读 · 2022年6月6日
【WWW2022】用于分布外推荐的因果表征学习
专知会员服务
19+阅读 · 2022年5月11日
【伯克利Lydia Liu博士论文】机器学习与决策的社会动力学
【CMU博士论文】通过记忆的元强化学习
专知会员服务
53+阅读 · 2021年10月16日
专知会员服务
14+阅读 · 2021年9月23日
2019->2020必看的十篇「深度学习领域综述」论文
极市平台
23+阅读 · 2020年1月2日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年6月24日
A Modern Introduction to Online Learning
Arxiv
20+阅读 · 2019年12月31日
Knowledge Representation Learning: A Quantitative Review
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员