2025年国际计算机视觉与模式识别会议(CVPR2025)于6月11日至15日在美国田纳西州纳什维尔召开,CVPR是计算机视觉和人工智能领域最具学术影响力的顶级会议之一。据CVPR官网显示,CVPR 2025收到了创新高的13008份论文(比CVPR 2024增加了12.8%),共录用了2878篇论文,接收率为 22.1%。来自Apple、Meta、微软撰写《视觉基础模型》进展教程,值得关注!

我们在此介绍我们关于“视觉基础模型的最新进展”的 CVPR 教程提案。该主题近年来受到计算机视觉领域广泛关注。我们的教程将涵盖视觉基础模型设计与开发方面的最前沿方向,包括以下几个关键内容及其最新方法与原理: 1. 为多模态理解与生成而学习视觉基础模型; 1. 扩展测试时的计算能力,并推动基础模型的自我训练,使其在推理与感知任务中自我改进; 1. 基于视觉基础模型的物理与虚拟智能体,这些智能体能够在机器人系统与虚拟环境中自主执行动作。

地址:https://vlp-tutorial.github.io/

讲者:

一、多模态大模型的进展:从“看见”到“理解”与“行动”

二、面向视觉中心的长时序任务的多模态推理

三、看、思考、行动:基于强化学习训练多模态智能体

四、迈向具备“看、思考与行动”能力的多模态人工智能智能体

成为VIP会员查看完整内容
4

相关内容

【AAAI2024教程】大模型知识编辑,192页ppt
专知会员服务
78+阅读 · 2024年2月29日
【AAAI2024教程】物理信息机器学习的最新进展
专知会员服务
71+阅读 · 2024年2月25日
【AAAI2023教程】大规模深度学习优化技术,109页ppt
专知会员服务
61+阅读 · 2023年2月10日
深度学习的冬天什么时候到来?
中国计算机学会
14+阅读 · 2019年7月17日
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
11+阅读 · 2022年9月1日
Arxiv
13+阅读 · 2021年10月22日
Arxiv
28+阅读 · 2021年9月18日
Arxiv
14+阅读 · 2021年3月10日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2018年9月23日
国家自然科学基金
0+阅读 · 2017年12月31日
国家自然科学基金
1+阅读 · 2016年12月31日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
3+阅读 · 2016年12月31日
国家自然科学基金
43+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年4月20日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
2+阅读 · 2014年12月31日
相关论文
Arxiv
170+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
464+阅读 · 2023年3月31日
Arxiv
11+阅读 · 2022年9月1日
Arxiv
13+阅读 · 2021年10月22日
Arxiv
28+阅读 · 2021年9月18日
Arxiv
14+阅读 · 2021年3月10日
Heterogeneous Graph Transformer
Arxiv
27+阅读 · 2020年3月3日
微信扫码咨询专知VIP会员