【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf - 专知VIP

会员服务 ·

25

人工智能 · 对齐学习 · 博士论文 ·

2024 年 4 月 2 日

【MIT博士论文】人工智能与人类对齐的构建模块：指定、检查、建模和修订，216页pdf

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

人工智能系统和机器人学习到的行为应当与其人类设计者的意图相对齐。为了达成这一目标，人们——特别是专家——必须能够轻松地指定、检查、建模和修订人工智能系统及机器人行为。这四种互动是人工智能对齐的关键构建模块。在这篇论文中，我研究了这些问题中的每一个。首先，我研究了专家如何为强化学习（RL）编写奖励函数规范。我发现这些规范是相对于RL算法编写的，并不是独立的，而且我发现即使在简单的设置中，专家们经常编写错误的规范，未能编码他们真正的意图。其次，我研究了如何支持人们检查代理的学习行为。为此，我引入了两种相关的贝叶斯推断方法，以找到引发特定系统行为的示例或环境；查看这些示例和环境有助于形成概念模型和系统调试。第三，我研究了认知科学理论，这些理论指导人们如何构建概念模型来解释观察到的代理行为示例。虽然我发现这些理论的一些基础被用于支持人类学习代理行为的典型干预中，但我也发现有很大的空间来构建更好的互动课程——例如，通过展示替代行为的反例。我通过推测这些人工智能交互的构建模块如何结合起来，使人们能够修订他们的规范，并通过这样做，创造更好对齐的代理来结束这篇论文。

成为VIP会员查看完整内容

44

相关内容

人工智能

人工智能(Artificial Intelligence, AI )是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能是计算机科学的一个分支。

【博士论文】语言模型与人类偏好对齐，148页pdf

【博士论文】语言模型与人类偏好对齐，148页pdf

专知会员服务

32+阅读 · 2024年4月21日

【ETHZ博士论文】学习理解图结构:从分类到生成，273页pdf

【ETHZ博士论文】学习理解图结构:从分类到生成，273页pdf

专知会员服务

48+阅读 · 2023年12月10日

【CMU博士论文】语言理解与生成优化技术，145页pdf

【CMU博士论文】语言理解与生成优化技术，145页pdf

专知会员服务

36+阅读 · 2023年11月22日

【MIT博士论文】高效可靠深度学习的共形方法，213页pdf

【MIT博士论文】高效可靠深度学习的共形方法，213页pdf

专知会员服务

42+阅读 · 2023年11月12日

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

专知会员服务

24+阅读 · 2023年9月28日

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

专知会员服务

70+阅读 · 2023年9月22日

【MIT博士论文】从结构化文档到结构化知识, 150页pdf

【MIT博士论文】从结构化文档到结构化知识, 150页pdf

专知会员服务

51+阅读 · 2023年8月10日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

【斯坦福博士论文】视频和语言中的高效事件理解，129页pdf

【斯坦福博士论文】视频和语言中的高效事件理解，129页pdf

专知会员服务

30+阅读 · 2023年7月21日

【密歇根大学博士论文】复杂时空过程的可解释可扩展图模型，241页pdf

【密歇根大学博士论文】复杂时空过程的可解释可扩展图模型，241页pdf

专知会员服务

56+阅读 · 2023年1月20日

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

51+阅读 · 2022年11月14日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

【AI+医疗】斯坦福大学最新博士论文《深度学习在医学影像理解中的应用》，205页pdf

【AI+医疗】斯坦福大学最新博士论文《深度学习在医学影像理解中的应用》，205页pdf

专知

23+阅读 · 2022年4月5日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

专知

17+阅读 · 2019年11月24日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

基于工业大数据挖掘的复杂产品总完工时间动态预测

国家自然科学基金

4+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩展工作条件下基于核免疫集成的SAR目标识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于结构化大数据深度挖掘的非寿险保险公司经营风险模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

压电智能作动器的高保真完整非线性动力学建模和高精度多通道运动协同同步控制系统一体化优化设计

国家自然科学基金

0+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

VIP会员

相关主题

相关VIP内容

【博士论文】语言模型与人类偏好对齐，148页pdf

【博士论文】语言模型与人类偏好对齐，148页pdf

专知会员服务

32+阅读 · 2024年4月21日

【ETHZ博士论文】学习理解图结构:从分类到生成，273页pdf

【ETHZ博士论文】学习理解图结构:从分类到生成，273页pdf

专知会员服务

48+阅读 · 2023年12月10日

【CMU博士论文】语言理解与生成优化技术，145页pdf

【CMU博士论文】语言理解与生成优化技术，145页pdf

专知会员服务

36+阅读 · 2023年11月22日

【MIT博士论文】高效可靠深度学习的共形方法，213页pdf

【MIT博士论文】高效可靠深度学习的共形方法，213页pdf

专知会员服务

42+阅读 · 2023年11月12日

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

【CMU博士论文】面向大规模和长期神经图表示，135页pdf

专知会员服务

24+阅读 · 2023年9月28日

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

【MIT博士论文】数据驱动的动态决策:算法、结构和复杂性分析，404页pdf

专知会员服务

70+阅读 · 2023年9月22日

【MIT博士论文】从结构化文档到结构化知识, 150页pdf

【MIT博士论文】从结构化文档到结构化知识, 150页pdf

专知会员服务

51+阅读 · 2023年8月10日

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

【MIT博士论文】机器学习基础：超参数化与特征学习，170页pdf

专知会员服务

41+阅读 · 2023年8月8日

【斯坦福博士论文】视频和语言中的高效事件理解，129页pdf

【斯坦福博士论文】视频和语言中的高效事件理解，129页pdf

专知会员服务

30+阅读 · 2023年7月21日

【密歇根大学博士论文】复杂时空过程的可解释可扩展图模型，241页pdf

【密歇根大学博士论文】复杂时空过程的可解释可扩展图模型，241页pdf

专知会员服务

56+阅读 · 2023年1月20日

热门VIP内容

开通专知VIP会员享更多权益服务

《乌克兰无人机产业：志愿者与政策在构建新兴无人机产业中的协同作用》最新报告

《人工智能辅助决策中的数据可视化：系统性综述》

人工智能驱动弹药制造现代化：美国陆军转型之路

《敏捷作战部署中枢纽-辐条基地选址优化研究》80页

相关资讯

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

推荐！《用于兵棋推演和建模的人工智能》兰德、耶鲁大学2022最新16页论文

专知

51+阅读 · 2022年11月14日

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

【254页博士论文】《动态多目标环境中基于深度强化学习的智能决策方案》

专知

32+阅读 · 2022年10月17日

【干货书】优化算法，232页pdf

【干货书】优化算法，232页pdf

专知

26+阅读 · 2022年9月8日

【2022新书】分布式机器学习Python实战，284页pdf

【2022新书】分布式机器学习Python实战，284页pdf

专知

14+阅读 · 2022年6月11日

【AI+医疗】斯坦福大学最新博士论文《深度学习在医学影像理解中的应用》，205页pdf

【AI+医疗】斯坦福大学最新博士论文《深度学习在医学影像理解中的应用》，205页pdf

专知

23+阅读 · 2022年4月5日

深度多模态表示学习综述论文，22页pdf

深度多模态表示学习综述论文，22页pdf

专知

33+阅读 · 2020年6月21日

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

【斯坦福CS520】向量空间中嵌入的知识图谱推理，48页ppt

专知

24+阅读 · 2020年6月11日

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

【哈工大车万翔教授】自然语言处理NLPer的核心竞争力是什么？19页ppt

专知

17+阅读 · 2019年11月24日

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

【CMU博士论文2019】建立知识感知的自然语言理解系统，附118页论文全文下载

专知

22+阅读 · 2019年10月23日

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

【伯克利Pieter Abbeel教授报告@CMU】元学习与深度强化学习的机器人应用，84页ppt

专知

13+阅读 · 2019年10月12日

相关基金

基于工业大数据挖掘的复杂产品总完工时间动态预测

国家自然科学基金

4+阅读 · 2015年12月31日

推荐系统的信息核挖掘及其应用研究

国家自然科学基金

8+阅读 · 2015年12月31日

面向类人机器人动作规划的参数最优控制技术研究

国家自然科学基金

2+阅读 · 2015年12月31日

Stokes/Darcy 耦合问题的数值方法及预处理技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

混合分布模型中序性质和维修策略的一些研究

国家自然科学基金

0+阅读 · 2015年12月31日

扩展工作条件下基于核免疫集成的SAR目标识别关键技术研究

国家自然科学基金

0+阅读 · 2015年12月31日

未知环境中移动机器人探索式路径规划方法研究

国家自然科学基金

7+阅读 · 2015年12月31日

基于结构化大数据深度挖掘的非寿险保险公司经营风险模型研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于第三方的APP软件质量度量和评估方法研究

国家自然科学基金

0+阅读 · 2014年12月31日

压电智能作动器的高保真完整非线性动力学建模和高精度多通道运动协同同步控制系统一体化优化设计

国家自然科学基金

0+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

171+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

A Survey on Graph Diffusion Models: Generative AI in Science for Molecule, Protein and Material

Arxiv

81+阅读 · 2023年4月4日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

477+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

147+阅读 · 2023年3月29日

ChatGPT is a Knowledgeable but Inexperienced Solver: An Investigation of Commonsense Problem in Large Language Models

Arxiv

61+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

78+阅读 · 2023年3月26日

Knowledge Graphs: Opportunities and Challenges

Arxiv

173+阅读 · 2023年3月24日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

51+阅读 · 2023年3月22日

Data-centric Artificial Intelligence: A Survey

Arxiv

24+阅读 · 2023年3月17日

微信扫码咨询专知VIP会员