【伯克利博士论文】可信赖机器学习，227页pdf - 专知VIP

会员服务 ·

41

可信赖机器学习 · 加州大学伯克利分校 (UC Berkeley) · 博士论文 ·

2022 年 12 月 12 日

【伯克利博士论文】可信赖机器学习，227页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

机器学习的现实应用通常具有复杂的目标和安全关键约束。当代的机器学习系统擅长于在具有简单程序指定目标的任务中实现高平均性能，但它们在许多要求更高的现实世界任务中很困难。本文致力于开发可信的机器学习系统，理解人类的价值观并可靠地优化它们。

机器学习的关键观点是，学习一个算法通常比直接写下来更容易，然而许多机器学习系统仍然有一个硬编码的、程序指定的目标。奖励学习领域将这种见解应用于学习目标本身。由于奖励函数和目标之间存在多对一的映射，我们首先引入由指定相同目标的奖励函数组成的等价类的概念。

在论文的第一部分，我们将等价类的概念应用于三种不同的情形。首先，我们研究了奖励函数的可识别性:哪些奖励函数集与数据兼容?我们首先对诱导相同数据的奖励函数的等价类进行分类。通过与上述最优策略等价类进行比较，我们可以确定给定数据源是否提供了足够的信息来恢复最优策略。

其次，我们解决了两个奖励函数等价类是相似还是不同的基本问题。我们在这些等价类上引入了一个距离度量，即等价策略不变比较(EPIC)，并表明即使在不同的过渡动态下，低EPIC距离的奖励也会诱导具有相似回报的策略。最后，我们介绍了奖励函数等价类的可解释性方法。该方法从等价类中选择最容易理解的代表函数，然后将代表函数可视化。

在论文的第二部分，我们研究了模型的对抗鲁棒性问题。本文首先介绍了一个物理上现实的威胁模型，包括在多智能体环境中行动的对抗性策略，以创建对防御者具有对抗性的自然观察。用深度强化学习训练对手，对抗一个冻结的最先进的防御者，该防御者通过自训练，以对对手强大。这种攻击可以可靠地战胜最先进的模拟机器人RL智能体和超人围棋程序。

最后，研究了提高智能体鲁棒性的方法。对抗性训练是无效的，而基于群体的训练作为一种部分防御提供了希望:它不能阻止攻击，但确实增加了攻击者的计算负担。使用显式规划也有帮助，因为我们发现具有大量搜索的防御者更难利用。

。

成为VIP会员查看完整内容

89

相关内容

可信赖机器学习

可信赖机器学习

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

74+阅读 · 2023年1月14日

【伯克利博士论文】机器学习安全性，172页pdf

【伯克利博士论文】机器学习安全性，172页pdf

专知会员服务

37+阅读 · 2022年12月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【伯克利Daniel Hendrycks博士论文】机器学习安全性，172页pdf

【伯克利Daniel Hendrycks博士论文】机器学习安全性，172页pdf

专知会员服务

40+阅读 · 2022年5月18日

【CMU博士论文】公平机器学习的黑盒方法，101页pdf

专知会员服务

48+阅读 · 2021年9月5日

【伯克利博士论文】深度强化学习的探索与安全性，178页pdf

专知会员服务

77+阅读 · 2021年5月23日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【斯坦福大学博士论文】鲁棒学习:信息论和算法，88页pdf

【斯坦福大学博士论文】鲁棒学习:信息论和算法，88页pdf

专知

2+阅读 · 2022年11月13日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知

5+阅读 · 2022年11月10日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知

1+阅读 · 2022年10月11日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知

2+阅读 · 2022年9月16日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

黎曼流形上 Ricci 曲率的几何

国家自然科学基金

3+阅读 · 2015年12月31日

基于数据的稀疏规则学习方法在全方向M型心动图系统辅助诊断中的应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

有限域上多项式的p-进与T-进指数和

国家自然科学基金

0+阅读 · 2013年12月31日

基于似然估计的梯度优化在变量带误差模型辨识中的收敛性分析

国家自然科学基金

0+阅读 · 2013年12月31日

非自治动力系统拉回指数吸引子的存在性及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

云计算中高效安全外包计算协议的研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂不确定环境下的多层规划模型与算法及其在生产控制中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

Euops属卷叶象甲与共生真菌的协同进化及化学机制

国家自然科学基金

0+阅读 · 2012年12月31日

面向数值程序安全性与鲁棒性的抽象解释技术

国家自然科学基金

0+阅读 · 2012年12月31日

参数多项式方程组求解及其在机器证明中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

Improved Robustness and Safety for Pre-Adaptation of Meta Reinforcement Learning with Prior Regularization

Arxiv

0+阅读 · 2023年2月9日

TPU-MLIR: A Compiler For TPU Using MLIR

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Flow Matching for Generative Modeling

Arxiv

0+阅读 · 2023年2月8日

Graph Anomaly Detection with Graph Neural Networks: Current Status and Challenges

Graph Anomaly Detection with Graph Neural Networks: Current Status and Challenges

Arxiv

22+阅读 · 2022年9月29日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

A Survey of Deep Learning for Low-Shot Object Detection

Arxiv

21+阅读 · 2021年12月6日

Self-supervised Learning: Generative or Contrastive

Arxiv

25+阅读 · 2021年3月20日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

VIP会员

相关主题

可信赖机器学习

加州大学伯克利分校 (UC Berkeley)

相关VIP内容

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

【剑桥大学博士论文】主动学习与序列决策研究进展，160页pdf

专知会员服务

78+阅读 · 2023年2月13日

【剑桥大学博士论文】机器学习安全性，148页pdf

【剑桥大学博士论文】机器学习安全性，148页pdf

专知会员服务

42+阅读 · 2023年2月13日

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

【UIUC博士论文】高效多智能体深度强化学习，130页pdf

专知会员服务

74+阅读 · 2023年1月14日

【伯克利博士论文】机器学习安全性，172页pdf

【伯克利博士论文】机器学习安全性，172页pdf

专知会员服务

37+阅读 · 2022年12月6日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知会员服务

104+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知会员服务

37+阅读 · 2022年9月16日

【伯克利Daniel Hendrycks博士论文】机器学习安全性，172页pdf

【伯克利Daniel Hendrycks博士论文】机器学习安全性，172页pdf

专知会员服务

40+阅读 · 2022年5月18日

【CMU博士论文】公平机器学习的黑盒方法，101页pdf

专知会员服务

48+阅读 · 2021年9月5日

【伯克利博士论文】深度强化学习的探索与安全性，178页pdf

专知会员服务

77+阅读 · 2021年5月23日

【CMU博士论文】机器人深度强化学习，128页pdf

【CMU博士论文】机器人深度强化学习，128页pdf

专知会员服务

133+阅读 · 2020年8月27日

热门VIP内容

开通专知VIP会员享更多权益服务

《战区安全决策课程体系》最新244页

《"无人机航母"原型平台》

任务规划与地形分析：现代复杂环境作战导航体系

《攻击场景描述形式化模型研究》

相关资讯

【CMU博士论文】黑盒和多目标优化策略，151页pdf

【CMU博士论文】黑盒和多目标优化策略，151页pdf

专知

13+阅读 · 2022年11月24日

【斯坦福大学博士论文】鲁棒学习:信息论和算法，88页pdf

【斯坦福大学博士论文】鲁棒学习:信息论和算法，88页pdf

专知

2+阅读 · 2022年11月13日

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

神经网络如何安全可靠？牛津大学博士论文《贝叶斯神经网络的对抗鲁棒性》，206页pdf

专知

5+阅读 · 2022年11月10日

【牛津大学博士论文】自监督学习视频理解，143页pdf

【牛津大学博士论文】自监督学习视频理解，143页pdf

专知

1+阅读 · 2022年10月11日

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

【牛津大学博士论文】神经网络中的无监督学习和连续学习，153页pdf

专知

6+阅读 · 2022年10月5日

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

【牛津大学博士论文】元强化学习的快速自适应，217页pdf

专知

29+阅读 · 2022年9月19日

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

【斯坦福博士论文】基于压缩模型高效验证的可信机器学习，90页pdf

专知

2+阅读 · 2022年9月16日

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

【MIT博士论文】实用机器学习的高效鲁棒算法，142页pdf

专知

5+阅读 · 2022年9月7日

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

如何稳健决策？MIT最新博士论文《鲁棒决策的端到端学习》234页pdf

专知

4+阅读 · 2022年9月1日

【MIT博士论文】数据高效强化学习，176页pdf

【MIT博士论文】数据高效强化学习，176页pdf

专知

18+阅读 · 2022年7月11日

相关基金

黎曼流形上 Ricci 曲率的几何

国家自然科学基金

3+阅读 · 2015年12月31日

基于数据的稀疏规则学习方法在全方向M型心动图系统辅助诊断中的应用研究

国家自然科学基金

1+阅读 · 2014年12月31日

有限域上多项式的p-进与T-进指数和

国家自然科学基金

0+阅读 · 2013年12月31日

基于似然估计的梯度优化在变量带误差模型辨识中的收敛性分析

国家自然科学基金

0+阅读 · 2013年12月31日

非自治动力系统拉回指数吸引子的存在性及其应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

云计算中高效安全外包计算协议的研究

国家自然科学基金

0+阅读 · 2012年12月31日

复杂不确定环境下的多层规划模型与算法及其在生产控制中的应用

国家自然科学基金

1+阅读 · 2012年12月31日

Euops属卷叶象甲与共生真菌的协同进化及化学机制

国家自然科学基金

0+阅读 · 2012年12月31日

面向数值程序安全性与鲁棒性的抽象解释技术

国家自然科学基金

0+阅读 · 2012年12月31日

参数多项式方程组求解及其在机器证明中的应用

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Improved Robustness and Safety for Pre-Adaptation of Meta Reinforcement Learning with Prior Regularization

Arxiv

0+阅读 · 2023年2月9日

TPU-MLIR: A Compiler For TPU Using MLIR

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Flow Matching for Generative Modeling

Arxiv

0+阅读 · 2023年2月8日

Graph Anomaly Detection with Graph Neural Networks: Current Status and Challenges

Graph Anomaly Detection with Graph Neural Networks: Current Status and Challenges

Arxiv

22+阅读 · 2022年9月29日

On Neural Differential Equations

Arxiv

23+阅读 · 2022年2月4日

A Survey of Deep Learning for Low-Shot Object Detection

Arxiv

21+阅读 · 2021年12月6日

Self-supervised Learning: Generative or Contrastive

Arxiv

25+阅读 · 2021年3月20日

CURL: Contrastive Unsupervised Representations for Reinforcement Learning

Arxiv

17+阅读 · 2020年4月28日

Demystifying MMD GANs

Arxiv

12+阅读 · 2018年1月12日

微信扫码咨询专知VIP会员