不可错过！《人工智能安全与对齐》课程 - 专知VIP

会员服务 ·

21

人工智能安全 · 人工智能对齐 · 大型语言模型 ·

2023 年 12 月 21 日

不可错过！《人工智能安全与对齐》课程

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

现代AI系统和方法带来了哪些存在性和社会风险？我们如何缓解这些风险，确保AI系统安全且与其构建者的意图保持一致？目前正在采取哪些措施以确保AI系统的安全性？当前的安全保障措施是否足够，如果不足，我们又该如何改进？这些是我们将在本高级研讨会中考虑的问题。将考虑来自多个学科的多样化主题，包括用于对齐的算法和优化方法、应用于AI的身心问题、责任与自由选择问题、AI突破预测的经济影响等。本课程的主题不包括AI公平性，因为这一重要主题已在其他课程中涵盖。

课程将呈现AI对齐和安全领域领先思想家的讲座，以及学生对讲师选定阅读材料的演讲。这是一门高级研究生课程，面向所有研究生和本科生开放，尽管预期需要在机器学习/人工智能方面有广泛的准备（需要COS 324或等同课程）。引言能力与扩展奖励与目标理解与匹配伦理对抗性攻击与红队操作对齐的博弈论方法可解释性人工通用智能（AGI）的经济影响 AGI在黑客/计算机安全方面的影响对AI风险的批评

https://sites.google.com/view/cos598aisafety/home?authuser=0

成为VIP会员查看完整内容

50

相关内容

人工智能安全

人工智能安全

人工智能安全风险指的是指安全威胁利用人工智能资产的脆弱性，引发人工智能安全事件或对相关方造成影响。

不可错过！斯坦福最新《大型语言模型与应用》课程，讲述LLMs技术栈和应用以及评估

不可错过！斯坦福最新《大型语言模型与应用》课程，讲述LLMs技术栈和应用以及评估

专知会员服务

103+阅读 · 2023年10月8日

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

专知会员服务

121+阅读 · 2023年5月26日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知会员服务

56+阅读 · 2022年11月2日

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知会员服务

24+阅读 · 2022年9月30日

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知会员服务

41+阅读 · 2022年5月2日

不可错过！Pisa大学最新《持续学习》课程，带你学习最新深度架构持续学习进展

不可错过！Pisa大学最新《持续学习》课程，带你学习最新深度架构持续学习进展

专知会员服务

29+阅读 · 2021年12月16日

不可错过！斯坦福<人工智能疾病诊断与信息推荐>2021课程，附Slides下载

不可错过！斯坦福<人工智能疾病诊断与信息推荐>2021课程，附Slides下载

专知会员服务

47+阅读 · 2021年4月29日

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

专知会员服务

65+阅读 · 2021年2月23日

不可错过！UIUC最新《对抗机器学习》课程，附PPT

专知会员服务

35+阅读 · 2020年12月28日

不可错过！斯坦福《医疗人工智能》2020课程，系统性讲述AI医学应用

不可错过！斯坦福《医疗人工智能》2020课程，系统性讲述AI医学应用

专知会员服务

132+阅读 · 2020年11月1日

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

专知

2+阅读 · 2023年4月7日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

17+阅读 · 2022年10月23日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

29+阅读 · 2022年5月26日

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

【知识图谱】重磅 | 知识图谱落地的基本原则与最佳实践

【知识图谱】重磅 | 知识图谱落地的基本原则与最佳实践

产业智能官

19+阅读 · 2019年7月30日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

MIT最新课程：一文看尽深度学习各领域最新突破(附视频、PPT)

MIT最新课程：一文看尽深度学习各领域最新突破(附视频、PPT)

全球人工智能

11+阅读 · 2019年1月19日

手把手教你如何部署深度学习模型

手把手教你如何部署深度学习模型

全球人工智能

17+阅读 · 2018年2月5日

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

2+阅读 · 2015年4月30日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

38+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

竞争供应链之间存在横向信息共享的采购策略与合同设计

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

150+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

VIP会员

相关主题

人工智能安全

人工智能对齐

大型语言模型

相关VIP内容

不可错过！斯坦福最新《大型语言模型与应用》课程，讲述LLMs技术栈和应用以及评估

不可错过！斯坦福最新《大型语言模型与应用》课程，讲述LLMs技术栈和应用以及评估

专知会员服务

103+阅读 · 2023年10月8日

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

大模型最权威课程！MIT最新《生成式AI-大模型》课程，MIT斯坦福OpenAI-DeepMind众多专家讲授

专知会员服务

121+阅读 · 2023年5月26日

不可错过！CMU《结构化数据机器学习》课程，附Slides

不可错过！CMU《结构化数据机器学习》课程，附Slides

专知会员服务

56+阅读 · 2022年11月2日

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

不可错过！首门《自监督学习统计模型》课程！霍普金斯Daniel Khashabi讲授

专知会员服务

24+阅读 · 2022年9月30日

不可错过！斯坦福《语音语言处理》技术课程

不可错过！斯坦福《语音语言处理》技术课程

专知会员服务

41+阅读 · 2022年5月2日

不可错过！Pisa大学最新《持续学习》课程，带你学习最新深度架构持续学习进展

不可错过！Pisa大学最新《持续学习》课程，带你学习最新深度架构持续学习进展

专知会员服务

29+阅读 · 2021年12月16日

不可错过！斯坦福<人工智能疾病诊断与信息推荐>2021课程，附Slides下载

不可错过！斯坦福<人工智能疾病诊断与信息推荐>2021课程，附Slides下载

专知会员服务

47+阅读 · 2021年4月29日

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

【AAAI2021】预训练语言模型最新进展，附113页ppt和视频

专知会员服务

65+阅读 · 2021年2月23日

不可错过！UIUC最新《对抗机器学习》课程，附PPT

专知会员服务

35+阅读 · 2020年12月28日

不可错过！斯坦福《医疗人工智能》2020课程，系统性讲述AI医学应用

不可错过！斯坦福《医疗人工智能》2020课程，系统性讲述AI医学应用

专知会员服务

132+阅读 · 2020年11月1日

热门VIP内容

开通专知VIP会员享更多权益服务

俄乌战争启示：坦克战与不断演变的战斗形态

《大规模作战行动中与无人机集成的C5ISR系统》

《主观概率约束下寻找可行系统及其军事应用》69页

《美政府问责局：多种挑战影响地面战车任务出勤率》2025最新130页

相关资讯

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

ChatGPT背后的语境学习技术是什么？霍普金斯最新NLP课程《In-context Learning》详解，63页ppt

专知

2+阅读 · 2023年4月7日

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

推荐！【系统工程顶点报告】《美国海军部用于人工智能 / 机器学习的数据管理》美国海军研究生院136页报告

专知

17+阅读 · 2022年10月23日

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

【干货书】实用时间序列分析：使用Python掌握时间序列数据处理、可视化和建模,238页pdf

专知

29+阅读 · 2022年5月26日

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

不可错过！图宾根大学《深度学习》课程，12讲述神经网络、GNN、GAN、序列模型等主题，附Slides与151页pdf笔记

专知

18+阅读 · 2021年5月8日

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

【DeepMind深度学习课程】神经网络基础，104页ppt，Neural Networks Foundations

专知

13+阅读 · 2020年6月24日

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

【实用书】Python文本分析第二版，688页pdf带你入门自然语言处理

专知

25+阅读 · 2020年5月15日

【知识图谱】重磅 | 知识图谱落地的基本原则与最佳实践

【知识图谱】重磅 | 知识图谱落地的基本原则与最佳实践

产业智能官

19+阅读 · 2019年7月30日

从入门到精通-Tensorflow深度强化学习课程

从入门到精通-Tensorflow深度强化学习课程

深度学习与NLP

23+阅读 · 2019年3月7日

MIT最新课程：一文看尽深度学习各领域最新突破(附视频、PPT)

MIT最新课程：一文看尽深度学习各领域最新突破(附视频、PPT)

全球人工智能

11+阅读 · 2019年1月19日

手把手教你如何部署深度学习模型

手把手教你如何部署深度学习模型

全球人工智能

17+阅读 · 2018年2月5日

相关基金

量子算法理论专题讲习班

国家自然科学基金

16+阅读 · 2017年12月31日

拓扑非线性分析专题讲习班

国家自然科学基金

15+阅读 · 2016年12月31日

支持新产品快速设计的复杂产品系统功能模块化方法

国家自然科学基金

1+阅读 · 2015年12月31日

反问题的数学建模、计算及应用

国家自然科学基金

3+阅读 · 2015年12月31日

面向交互式问答的省略恢复技术研究

国家自然科学基金

5+阅读 · 2015年12月31日

基因表达专题讲习班

国家自然科学基金

2+阅读 · 2015年4月30日

面向复杂情报的大数据分析方法与决策支持

国家自然科学基金

38+阅读 · 2014年12月31日

上市公司文本信息分析研究：基于大数据的视角

国家自然科学基金

8+阅读 · 2014年12月31日

竞争供应链之间存在横向信息共享的采购策略与合同设计

国家自然科学基金

0+阅读 · 2014年12月31日

面向词汇功能的学术文本语义识别与知识图谱构建

国家自然科学基金

5+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

219+阅读 · 2023年4月7日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

84+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

482+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

150+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

62+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

79+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

175+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

25+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员