Compound AI systems, comprising multiple interacting components such as LLMs, foundation models, and external tools, have demonstrated remarkable improvements compared to single models in various tasks. To ensure their effective deployment in real-world applications, aligning these systems with human preferences is crucial. However, aligning the compound system via policy optimization, unlike the alignment of a single model, is challenging for two main reasons: (i) non-differentiable interactions between components make end-to-end gradient-based optimization method inapplicable, and (ii) system-level preferences cannot be directly transformed into component-level preferences. To address these challenges, we first formulate compound AI systems as Directed Acyclic Graphs (DAGs), explicitly modeling both component interactions and the associated data flows. Building on this formulation, we introduce $\textbf{SysDPO}$, a framework that extends Direct Preference Optimization (DPO) to enable joint system-level alignment. We propose two variants, SysDPO-Direct and SysDPO-Sampling, tailored for scenarios depending on whether we construct a system-specific preference dataset. We empirically demonstrate the effectiveness of our approach across two applications: the joint alignment of a language model and a diffusion model, and the joint alignment of an LLM collaboration system.


翻译:复合人工智能系统由多个交互组件构成,例如大型语言模型(LLMs)、基础模型和外部工具,相较于单一模型,在多种任务中已展现出显著的性能提升。为确保其在现实应用中的有效部署,使这些系统与人类偏好对齐至关重要。然而,与单一模型的对齐不同,通过策略优化对齐复合系统面临两大挑战:(i)组件间的不可微交互使得基于梯度的端到端优化方法无法适用;(ii)系统级偏好无法直接转化为组件级偏好。为解决这些挑战,我们首先将复合人工智能系统形式化为有向无环图(DAGs),明确建模组件交互及相关数据流。基于此形式化框架,我们提出$\textbf{SysDPO}$,一个将直接偏好优化(DPO)扩展至实现联合系统级对齐的框架。我们设计了两种变体:SysDPO-Direct和SysDPO-Sampling,分别适用于是否构建系统特定偏好数据集的场景。通过实验,我们在两个应用中验证了该方法的有效性:语言模型与扩散模型的联合对齐,以及大型语言模型协作系统的联合对齐。

0
下载
关闭预览

相关内容

专知会员服务
41+阅读 · 2021年6月19日
【ICML2020】持续终身学习的神经主题建模
专知会员服务
39+阅读 · 2020年6月22日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
10+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员