Camouflaged image generation (CIG) has recently emerged as an efficient alternative for acquiring high-quality training data for camouflaged object detection (COD). However, existing CIG methods still suffer from a substantial gap to real camouflaged imagery: generated images either lack sufficient camouflage due to weak visual similarity, or exhibit cluttered backgrounds that are semantically inconsistent with foreground targets. To address these limitations, we propose ReamCamo, a unified out-painting based framework for realistic camouflaged image generation. ReamCamo explicitly introduces additional layout controls to regulate global image structure, thereby improving semantic coherence between foreground objects and generated backgrounds. Moreover, we construct a multi-modal textual-visual condition by combining a unified fine-grained textual task description with texture-oriented background retrieval, which jointly guides the generation process to enhance visual fidelity and realism. To quantitatively assess camouflage quality, we further introduce a background-foreground distribution divergence metric that measures the effectiveness of camouflage in generated images. Extensive experiments and visualizations demonstrate the effectiveness of our proposed framework.


翻译:伪装图像生成(CIG)近期已成为获取高质量伪装目标检测(COD)训练数据的一种高效替代方案。然而,现有的CIG方法仍与真实伪装图像存在显著差距:生成的图像或因视觉相似性不足而缺乏足够的伪装效果,或呈现出与前景目标语义不一致的杂乱背景。为应对这些局限性,我们提出了RealCamo——一个基于外绘制的统一框架,用于生成逼真的伪装图像。RealCamo显式地引入额外的布局控制来规范全局图像结构,从而提升前景物体与生成背景之间的语义一致性。此外,我们通过结合统一的细粒度文本任务描述与面向纹理的背景检索,构建了一个多模态的文本-视觉条件,共同引导生成过程以增强视觉保真度与真实感。为定量评估伪装质量,我们进一步提出了一种背景-前景分布差异度量,用于衡量生成图像中伪装的有效性。大量的实验与可视化结果证明了我们所提框架的有效性。

0
下载
关闭预览

相关内容

ChatAug: 利用ChatGPT进行文本数据增强
专知会员服务
81+阅读 · 2023年3月4日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员