LangDriveCTRL is a natural-language-controllable framework for editing real-world driving videos to synthesize diverse traffic scenarios. It leverages explicit 3D scene decomposition to represent driving videos as a scene graph, containing static background and dynamic objects. To enable fine-grained editing and realism, it incorporates an agentic pipeline in which an Orchestrator transforms user instructions into execution graphs that coordinate specialized agents and tools. Specifically, an Object Grounding Agent establishes correspondence between free-form text descriptions and target object nodes in the scene graph; a Behavior Editing Agent generates multi-object trajectories from language instructions; and a Behavior Reviewer Agent iteratively reviews and refines the generated trajectories. The edited scene graph is rendered and then refined using a video diffusion tool to address artifacts introduced by object insertion and significant view changes. LangDriveCTRL supports both object node editing (removal, insertion and replacement) and multi-object behavior editing from a single natural-language instruction. Quantitatively, it achieves nearly $2\times$ higher instruction alignment than the previous SoTA, with superior structural preservation, photorealism, and traffic realism. Project page is available at: https://yunhe24.github.io/langdrivectrl/.


翻译:LangDriveCTRL 是一个自然语言可控的框架,用于编辑真实世界驾驶视频以合成多样化的交通场景。它利用显式的三维场景分解,将驾驶视频表示为包含静态背景和动态物体的场景图。为实现细粒度编辑与真实感,该框架引入了一个智能体流程,其中协调器将用户指令转换为执行图,以协调专用智能体与工具。具体而言,物体定位智能体在自由形式的文本描述与场景图中的目标物体节点之间建立对应关系;行为编辑智能体根据语言指令生成多物体轨迹;行为评审智能体则迭代地评审并优化生成的轨迹。编辑后的场景图经渲染后,通过视频扩散工具进行细化,以解决物体插入和显著视角变化引入的伪影问题。LangDriveCTRL 支持通过单一自然语言指令进行物体节点编辑(移除、插入和替换)以及多物体行为编辑。定量评估表明,其在指令对齐度上达到先前最优方法的近 $2\times$ 提升,同时在结构保持、照片真实感和交通真实性方面表现优异。项目页面位于:https://yunhe24.github.io/langdrivectrl/。

0
下载
关闭预览

相关内容

深度学习人脸识别系统DFace
深度学习
17+阅读 · 2018年2月14日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员