【NeurIPS2024】释放扩散模型在小样本语义分割中的潜力 - 专知VIP

会员服务 ·

11

NeurIPS 2024 · 扩散模型 · 小样本语义分割 ·

2024 年 10 月 4 日

【NeurIPS2024】释放扩散模型在小样本语义分割中的潜力

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

扩散模型（Diffusion Model）不仅在图像生成领域取得了显著成果，还展示了作为一种利用未标注数据的有效预训练方法的潜力。鉴于扩散模型在语义对应和开放词汇分割中的广泛潜力，我们的研究启动了将潜在扩散模型（Latent Diffusion Model）应用于小样本语义分割的探索。最近，受到大型语言模型上下文学习能力的启发，小样本语义分割逐渐演变为上下文分割任务，成为评估通用分割模型的重要元素。在此背景下，我们专注于小样本语义分割，为基于扩散模型的通用分割模型的未来发展奠定坚实基础。我们的初步重点在于理解如何促进查询图像与支持图像之间的交互，并在此基础上提出了一种在自注意力框架中的 KV 融合方法。接下来，我们深入优化了支持掩码信息的注入方式，同时重新评估如何从查询掩码中提供合理的监督。基于我们的分析，我们建立了一个名为 DiffewS 的简单而有效的框架，最大程度地保留了原始潜在扩散模型的生成框架，并有效利用了预训练先验。实验结果表明，我们的方法在多种设置下显著优于先前的最先进（SOTA）模型。

https://www.zhuanzhi.ai/paper/dead1a1c65dabbbea61fa5bfe6709e7c

成为VIP会员查看完整内容

17

相关内容

NeurIPS 2024

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

专知会员服务

11+阅读 · 2024年5月13日

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

专知会员服务

27+阅读 · 2024年5月11日

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

专知会员服务

21+阅读 · 2024年4月18日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

专知会员服务

34+阅读 · 2024年1月21日

【NeurIPS2023】将持续学习重新定义为序列建模

【NeurIPS2023】将持续学习重新定义为序列建模

专知会员服务

35+阅读 · 2023年10月19日

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

专知会员服务

34+阅读 · 2023年10月8日

【ICML2023】知识蒸馏对模型可解释性的影响

【ICML2023】知识蒸馏对模型可解释性的影响

专知会员服务

37+阅读 · 2023年5月27日

【KDD2021】高效数据特定模型搜索的协同过滤

专知会员服务

15+阅读 · 2021年6月26日

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

7+阅读 · 2015年12月31日

HDFS读、写性能概率建模与模型迁移方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

5+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

The effect of different feature selection methods on models created with XGBoost

Arxiv

0+阅读 · 2024年11月8日

Discretize first, filter next: learning divergence-consistent closure models for large-eddy simulation

Arxiv

0+阅读 · 2024年11月8日

Towards computational methods for category theory

Arxiv

0+阅读 · 2024年11月8日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

169+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

39+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

209+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

459+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

142+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

VIP会员

相关主题

小样本语义分割

相关VIP内容

【ICML2024】深度强化学习中的随机潜在探索

【ICML2024】深度强化学习中的随机潜在探索

专知会员服务

20+阅读 · 2024年7月19日

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

【ICML2024】通过代理基于的不确定性估计提高语言模型中的指令遵循性

专知会员服务

11+阅读 · 2024年5月13日

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

【ICML2024】VisionGraph：利用大型多模态模型解决视觉环境中的图论问题

专知会员服务

27+阅读 · 2024年5月11日

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

【CVPR2024】探索多模态大型语言模型中视觉提示的可转移性

专知会员服务

21+阅读 · 2024年4月18日

【CVPR2024】视觉-语言模型的高效测试时间调整

【CVPR2024】视觉-语言模型的高效测试时间调整

专知会员服务

20+阅读 · 2024年3月30日

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

【ICLR2024】为样本高效的强化学习预训练基于目标的模型

专知会员服务

34+阅读 · 2024年1月21日

【NeurIPS2023】将持续学习重新定义为序列建模

【NeurIPS2023】将持续学习重新定义为序列建模

专知会员服务

35+阅读 · 2023年10月19日

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

【NeurIPS2023】探索具有对抗环境设计的通用强化学习算法

专知会员服务

34+阅读 · 2023年10月8日

【ICML2023】知识蒸馏对模型可解释性的影响

【ICML2023】知识蒸馏对模型可解释性的影响

专知会员服务

37+阅读 · 2023年5月27日

【KDD2021】高效数据特定模型搜索的协同过滤

专知会员服务

15+阅读 · 2021年6月26日

热门VIP内容

开通专知VIP会员享更多权益服务

零样本量化：综述

【EPFL博士论文】现代深度学习中的不确定性建模，169页pdf

电力人工智能技术研究框架、应用现状及展望

【ICML2025】组合优化问题中的偏好优化

相关资讯

【CVPR2021】跨模态检索的概率嵌入

【CVPR2021】跨模态检索的概率嵌入

专知

17+阅读 · 2021年3月2日

【KDD2020】图神经网络生成式预训练

【KDD2020】图神经网络生成式预训练

专知

22+阅读 · 2020年7月3日

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

【KDD2020】XGNN-可解释图神经网络，从模型级解释构建可信赖GNN

专知

17+阅读 · 2020年6月7日

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

【IJCAI2020】基于生成对抗模仿学习的多模态模仿学习算法框架

专知

20+阅读 · 2020年5月26日

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

【CVPR2020】L2 ^GCN：图卷积网络的分层学习高效训练

专知

12+阅读 · 2020年3月31日

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

【三星AI-CVPR2020】增量小样本目标检测，Incremental Few-Shot Object Detection

专知

55+阅读 · 2020年3月11日

【Amazon】使用预训练Transformer模型进行数据增强

【Amazon】使用预训练Transformer模型进行数据增强

专知

12+阅读 · 2020年3月6日

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

【Google AI新论文】REALM:检索增强语言模型预训练，QA的SOTA提升4-16%准确性

专知

12+阅读 · 2020年2月12日

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

【伯克利PNAS最新论文】可解释机器学习的定义、方法和应用

专知

76+阅读 · 2019年10月20日

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

BAM！利用知识蒸馏和多任务学习构建的通用语言模型

机器之心

15+阅读 · 2019年3月18日

相关基金

组合测试用例优先排序算法及选择策略研究

国家自然科学基金

7+阅读 · 2015年12月31日

HDFS读、写性能概率建模与模型迁移方法研究

国家自然科学基金

0+阅读 · 2015年12月31日

基于反馈型级联连接模型的多模态语义SFM方法研究

国家自然科学基金

2+阅读 · 2015年12月31日

半参数空间自回归模型的理论研究及应用

国家自然科学基金

0+阅读 · 2015年12月31日

基于自主学习的Ad hoc Agent序贯决策研究

国家自然科学基金

43+阅读 · 2015年12月31日

模糊认知集群优化的聚类算法

国家自然科学基金

8+阅读 · 2015年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

5+阅读 · 2014年12月31日

复杂多元数据的半参数统计推断

国家自然科学基金

5+阅读 · 2014年12月31日

基于模型驱动的并发建模语言Apla+设计及其可靠性研究

国家自然科学基金

3+阅读 · 2014年12月31日

相关论文

The effect of different feature selection methods on models created with XGBoost

Arxiv

0+阅读 · 2024年11月8日

Discretize first, filter next: learning divergence-consistent closure models for large-eddy simulation

Arxiv

0+阅读 · 2024年11月8日

Towards computational methods for category theory

Arxiv

0+阅读 · 2024年11月8日

Is ChatGPT a Good Recommender? A Preliminary Study

Arxiv

169+阅读 · 2023年4月20日

NeuralField-LDM: Scene Generation with Hierarchical Latent Diffusion Models

Arxiv

39+阅读 · 2023年4月19日

On Efficient Training of Large-Scale Deep Learning Models: A Literature Review

Arxiv

209+阅读 · 2023年4月7日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

459+阅读 · 2023年3月31日

Unleashing the Power of Edge-Cloud Generative AI in Mobile Networks: A Survey of AIGC Services

Arxiv

142+阅读 · 2023年3月29日

Nature Language Reasoning, A Survey

Arxiv

76+阅读 · 2023年3月26日

Sparks of Artificial General Intelligence: Early experiments with GPT-4

Arxiv

49+阅读 · 2023年3月22日

微信扫码咨询专知VIP会员