【ACL2025教程】逆向强化学习遇上大语言模型对齐，173页ppt - 专知VIP

会员服务 ·

18

ACL 2025 · 逆强化学习 · 大语言模型 ·

【ACL2025教程】逆向强化学习遇上大语言模型对齐，173页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

大语言模型（LLM）的对齐问题仍是强化学习领域中最关键的挑战之一。正如 DeepSeek-R1 等模型的成功所展示的那样，提升对齐效果不仅依赖于更优的模型架构，还需对强化学习（RL）和奖励建模有更深入的理解。本教程将探讨逆向强化学习（Inverse Reinforcement Learning, IRL）与大语言模型对齐之间的关联，为研究人员和实践者提供一条结构化的研究路径。我们将 LLM 对齐建模为一个逆强化学习问题，对比传统强化学习与从人类数据中推断奖励的逆向方法。教程重点聚焦于奖励模型，探讨其如何从不同类型的数据中构建，包括数学推理、二元反馈、偏好数据以及示范行为等。在理论之外，我们还将探讨基础设施与实践实现，展示如何在几分钟内高效评估基于 IRL 的 LLM 对齐思路。最后，教程将结合稀疏奖励强化学习的相关经验，介绍奖励塑形（reward shaping）、责任归因（credit assignment）以及自对弈（self-play）中获得的启示。通过本教程，参与者将从理论和实践两个维度深入理解基于 IRL 的大语言模型对齐方法，并掌握高效构建更好对齐模型的核心工具。

成为VIP会员查看完整内容

25

相关内容

ACL 2025

【ACL2024教程】大型语言模型对抗攻击的脆弱性，200多页ppt

【ACL2024教程】大型语言模型对抗攻击的脆弱性，200多页ppt

专知会员服务

34+阅读 · 2024年8月14日

【EMNLP2023教程】自然语言生成，249页ppt

【EMNLP2023教程】自然语言生成，249页ppt

专知会员服务

60+阅读 · 2023年12月9日

【EMNLP2023教程】自然语言处理可视化,200页ppt

【EMNLP2023教程】自然语言处理可视化,200页ppt

专知会员服务

53+阅读 · 2023年12月6日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知会员服务

46+阅读 · 2022年7月21日

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

29+阅读 · 2021年8月26日

【干货书】机器学习线性代数与优化，507页pdf

【干货书】机器学习线性代数与优化，507页pdf

专知

23+阅读 · 2022年7月28日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

最新！Yann Lecun 纽约大学Spring2020深度学习课程，附66页PPT下载

最新！Yann Lecun 纽约大学Spring2020深度学习课程，附66页PPT下载

专知

16+阅读 · 2020年1月28日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

VIP会员

相关主题

逆强化学习

大语言模型

相关VIP内容

【ACL2024教程】大型语言模型对抗攻击的脆弱性，200多页ppt

【ACL2024教程】大型语言模型对抗攻击的脆弱性，200多页ppt

专知会员服务

34+阅读 · 2024年8月14日

【EMNLP2023教程】自然语言生成，249页ppt

【EMNLP2023教程】自然语言生成，249页ppt

专知会员服务

60+阅读 · 2023年12月9日

【EMNLP2023教程】自然语言处理可视化,200页ppt

【EMNLP2023教程】自然语言处理可视化,200页ppt

专知会员服务

53+阅读 · 2023年12月6日

【ICML2022教程】智能交互式学习，80页ppt

【ICML2022教程】智能交互式学习，80页ppt

专知会员服务

46+阅读 · 2022年7月21日

【伯克利-Pieter Abbeel】深度强化学习基础，附slides与视频

专知会员服务

29+阅读 · 2021年8月26日

热门VIP内容

开通专知VIP会员享更多权益服务

美海军作战管理系统：变革战场空间的二十年

《任务与武器驱动美海军舰队设计》报告

俄罗斯“沙希德”/“天竺葵”攻击无人机

《利用动态图对网络攻击进行建模与仿真：在云安全评估中的应用》90页

相关资讯

【干货书】机器学习线性代数与优化，507页pdf

【干货书】机器学习线性代数与优化，507页pdf

专知

23+阅读 · 2022年7月28日

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

【NeurIPS 2020 Tutorial】离线强化学习:从算法到挑战，80页ppt

专知

16+阅读 · 2020年12月9日

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

【万字长文总结】如何解决"稀疏奖励(Sparse Reward)"下的强化学习问题？

深度强化学习实验室

43+阅读 · 2020年7月6日

最新！Yann Lecun 纽约大学Spring2020深度学习课程，附66页PPT下载

最新！Yann Lecun 纽约大学Spring2020深度学习课程，附66页PPT下载

专知

16+阅读 · 2020年1月28日

斯坦福CS236-深度生成模型2019-全套课程资料分享

斯坦福CS236-深度生成模型2019-全套课程资料分享

深度学习与NLP

20+阅读 · 2019年8月20日

相关基金

核心化算法中的新技术研究

国家自然科学基金

8+阅读 · 2017年12月31日

面向大数据的安全迁移学习方法

国家自然科学基金

29+阅读 · 2015年12月31日

进化算法行为分析及应用

国家自然科学基金

1+阅读 · 2015年12月31日

动态Gr？bner 基与GVW算法

国家自然科学基金

0+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

A survey and taxonomy of loss functions in machine learning

Arxiv

27+阅读 · 2023年1月13日

Deep learning: a statistical viewpoint

Arxiv

18+阅读 · 2021年3月16日

How to train your MAML

Arxiv

26+阅读 · 2019年3月5日

微信扫码咨询专知VIP会员