题目: Safe Machine Learning

简介:

随着我们将ML应用到越来越多的现实任务中,我们正在走向一个ML将在未来社会中扮演越来越重要角色。因此,解决安全问题正成为一个日益紧迫的问题。一般来说,我们可以将当前的安全研究分为三个领域:规范、健壮性和保证。规范关注于调查和开发技术,以减轻由于目标仅仅是期望的替代者而可能出现的系统不期望的行为。这种情况可能会发生,例如,当对包含历史偏差的数据集进行训练时,或者在真实环境中尝试度量增强学习智能体的进度时鲁棒性处理在推断新数据和响应敌对输入时处理系统故障。

Assurance涉及到开发方法,使我们能够理解本质上不透明和黑箱的系统,并在操作期间控制它们。本教程将概述这三个领域,特别关注规范,更具体地说,关注增强学习智能体的公平性和一致性。其目的是激发从事不同安全领域的研究人员之间的讨论。

邀请嘉宾:

Silvia Chiappa是DeepMind机器学习方面的研究科学家。她拥有数学文凭和机器学习博士学位。在加入DeepMind之前,Silvia Chiappa曾在马克斯-普朗克智能系统研究所的经验推理部门、微软剑桥研究院的机器智能与感知小组以及剑桥大学的统计实验室工作。她的研究兴趣是基于贝叶斯和因果推理,图形模型,变分推理,时间序列模型,ML公平性和偏差。

Jan Leike是DeepMind的高级研究科学家,他在那里研究智能体对齐问题。他拥有澳大利亚国立大学的计算机科学博士学位,在那里他致力于理论强化学习。在加入DeepMind之前,他是牛津大学的博士后研究员。Jan的研究兴趣是人工智能安全、强化学习和技术人工智能治理。

成为VIP会员查看完整内容
19

相关内容

认知偏误(cognitive bias)或认知偏差、认知偏见是有特定模式的判断偏差,主要是由于人们以根据主观感受而非客观资讯建立起主观以为的社会现实所致。认知偏误可导致感知失真、判断不精准、解释不合逻辑、或各种统称“不理性”的结果。
ICML2019《元学习》教程与必读论文列表
专知
39+阅读 · 2019年6月16日
一文读懂机器学习中的贝叶斯统计学
数据分析
24+阅读 · 2019年5月8日
已删除
将门创投
9+阅读 · 2018年12月19日
ICML2018 模仿学习教程
专知
5+阅读 · 2018年7月14日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
11+阅读 · 2018年4月27日
Machine Learning:十大机器学习算法
开源中国
12+阅读 · 2018年3月1日
A Modern Introduction to Online Learning
Arxiv
17+阅读 · 2019年12月31日
Arxiv
13+阅读 · 2019年11月24日
A Comprehensive Survey on Transfer Learning
Arxiv
107+阅读 · 2019年11月7日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Arxiv
44+阅读 · 2018年12月11日
Adversarial Transfer Learning
Arxiv
10+阅读 · 2018年12月6日
VIP会员
相关VIP内容
相关资讯
ICML2019《元学习》教程与必读论文列表
专知
39+阅读 · 2019年6月16日
一文读懂机器学习中的贝叶斯统计学
数据分析
24+阅读 · 2019年5月8日
已删除
将门创投
9+阅读 · 2018年12月19日
ICML2018 模仿学习教程
专知
5+阅读 · 2018年7月14日
Reinforcement Learning: An Introduction 2018第二版 500页
CreateAMind
11+阅读 · 2018年4月27日
Machine Learning:十大机器学习算法
开源中国
12+阅读 · 2018年3月1日
相关论文
A Modern Introduction to Online Learning
Arxiv
17+阅读 · 2019年12月31日
Arxiv
13+阅读 · 2019年11月24日
A Comprehensive Survey on Transfer Learning
Arxiv
107+阅读 · 2019年11月7日
Learning to Weight for Text Classification
Arxiv
8+阅读 · 2019年3月28日
Arxiv
44+阅读 · 2018年12月11日
Adversarial Transfer Learning
Arxiv
10+阅读 · 2018年12月6日
微信扫码咨询专知VIP会员