【NeurIPS2024】释放扩散模型在小样本语义分割中的潜力 - 专知VIP

会员服务 ·

11

NeurIPS 2024 · 扩散模型 · 小样本语义分割 ·

2024 年 10 月 4 日

【NeurIPS2024】释放扩散模型在小样本语义分割中的潜力

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

扩散模型（Diffusion Model）不仅在图像生成领域取得了显著成果，还展示了作为一种利用未标注数据的有效预训练方法的潜力。鉴于扩散模型在语义对应和开放词汇分割中的广泛潜力，我们的研究启动了将潜在扩散模型（Latent Diffusion Model）应用于小样本语义分割的探索。最近，受到大型语言模型上下文学习能力的启发，小样本语义分割逐渐演变为上下文分割任务，成为评估通用分割模型的重要元素。在此背景下，我们专注于小样本语义分割，为基于扩散模型的通用分割模型的未来发展奠定坚实基础。我们的初步重点在于理解如何促进查询图像与支持图像之间的交互，并在此基础上提出了一种在自注意力框架中的 KV 融合方法。接下来，我们深入优化了支持掩码信息的注入方式，同时重新评估如何从查询掩码中提供合理的监督。基于我们的分析，我们建立了一个名为 DiffewS 的简单而有效的框架，最大程度地保留了原始潜在扩散模型的生成框架，并有效利用了预训练先验。实验结果表明，我们的方法在多种设置下显著优于先前的最先进（SOTA）模型。

https://www.zhuanzhi.ai/paper/dead1a1c65dabbbea61fa5bfe6709e7c

成为VIP会员查看完整内容

17

相关内容

NeurIPS 2024

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

专知会员服务

11+阅读 · 2024年5月13日

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

专知会员服务

21+阅读 · 2024年4月18日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

专知会员服务

35+阅读 · 2023年10月8日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

496+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

153+阅读 · 2023年3月29日

VIP会员

相关主题

小样本语义分割

相关VIP内容

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

专知会员服务

11+阅读 · 2024年5月13日

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

专知会员服务

21+阅读 · 2024年4月18日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

专知会员服务

35+阅读 · 2023年10月8日

热门VIP内容

开通专知VIP会员享更多权益服务

【斯坦福博士论文】数据、决策与过度依赖：构建可信人工智能的核心挑战

《多域时代中维持弹性军事训练：挑战与机遇》

【AAAI2026】专家数量何为最优？面向混合专家模型的语义专业化优化研究

自进化人工智能体的全面综述：连接基础模型与终身自主智能系统的新范式

相关资讯

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

23+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

相关基金

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

46+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

相关论文

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

174+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

42+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

224+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

496+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

153+阅读 · 2023年3月29日

微信扫码咨询专知VIP会员