【剑桥大学博士论文】计算机系统中的端到端深度强化学习,188页pdf

2022 年 10 月 31 日 专知


长期以来,随着数据处理系统的复杂性不断增加,系统设计者一直在想象能够根据环境线索进行自我配置和适应的系统(如数据库、调度程序)。在这种情况下,强化学习(RL)方法从一开始就吸引了系统开发人员。他们承诺从原始反馈信号中获取复杂的决策策略。尽管RL方法在概念上很流行,但在现实世界的数据处理系统中却很少见到。最近,由于利用大型神经网络(深度强化学习)取得了引人注目的成功,RL受到了爆炸性增长的关注。新兴的机器学习框架和强大的硬件加速器催生了大量新的潜在应用。在本文中,我首先提出,为了高效地设计和执行深度RL算法,需要新颖的软件抽象来适应通信密集和快速进化算法的独特计算模式。我提出了一种将逻辑算法构造与本地和分布式执行语义解耦的体系结构。我将进一步介绍RLgraph,这是我对这个体系结构的概念验证实现。在RLgraph中,算法开发人员可以通过组合逻辑组件构建高级数据流图来探索新的设计。此数据流图独立于特定的后端框架或执行概念,只在以后通过分阶段构建过程映射到执行语义。RLgraph支持高性能算法实现,同时保持快速原型的灵活性。

https://www.repository.cam.ac.uk/handle/1810/304385

其次,我研究了系统本身中RL应用程序稀缺的原因。我认为,由于缺乏用于任务模型设计的工具来弥合系统和算法之间的差距,以及缺乏评估模型能力的共同标准,应用RL的进展受到了阻碍。在本文中,我介绍了应用RL中第一个用于增量模型设计的工具——Wield。Wield 提供了一小组原语,将系统接口和特定于部署的配置从表示中分离出来。运用的核心是一种新的指导性实验协议,称为渐进随机化,它帮助从业者逐步评估非确定性的不同维度。我演示了如何使用和渐进的随机化可以用来再现和评估之前的工作,并指导新RL应用程序的实现。


专知便捷查看

便捷下载,请关注专知公众号(点击上方蓝色专知关注)

  • 后台回复“R188” 就可以获取 【剑桥大学博士论文】计算机系统中的端到端深度强化学习,188页pdf》专知下载链接

                       
专知,专业可信的人工智能知识分发 ,让认知协作更快更好!欢迎注册登录专知www.zhuanzhi.ai,获取100000+AI(AI与军事、医药、公安等)主题干货知识资料!
欢迎微信扫一扫加入专知人工智能知识星球群,获取最新AI专业干货知识教程资料和与专家交流咨询
点击“ 阅读原文 ”,了解使用 专知 ,查看获取100000+AI主题知识资料

登录查看更多
6

相关内容

计算机系统可划分为软件系统与硬件系统两大类。
    • 冯·诺伊曼结构
    • 哈佛结构
  • 输入/输出和数据通信
  • 数字逻辑
  • 逻辑设计
  • 集成电路
【AI与工业】2022最新发布《工业物联网AI框架》59页PDF
专知会员服务
144+阅读 · 2022年3月30日
【新书】分布式强化学习,280页pdf
专知会员服务
155+阅读 · 2021年12月19日
【CMU博士论文】机器人深度强化学习,128页pdf
专知会员服务
130+阅读 · 2020年8月27日
专知会员服务
209+阅读 · 2019年8月30日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
国家自然科学基金
22+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
9+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Arxiv
66+阅读 · 2022年4月13日
Arxiv
23+阅读 · 2022年2月24日
Arxiv
65+阅读 · 2021年6月18日
Arxiv
35+阅读 · 2020年1月2日
VIP会员
相关基金
国家自然科学基金
22+阅读 · 2016年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
9+阅读 · 2011年12月31日
国家自然科学基金
2+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
2+阅读 · 2009年12月31日
国家自然科学基金
1+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员