【CVPR2024教程】微软等最新《视觉基础模型进展》教程，附274页ppt - 专知VIP

会员服务 ·

24

CVPR 2024 · 视觉基础模型 · 大模型 ·

2024 年 6 月 20 日

【CVPR2024教程】微软等最新《视觉基础模型进展》教程，附274页ppt

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

6 月 17 日至 21 日，计算机视觉领域顶级盛会之一国际计算机视觉与模式识别会议（CVPR 2024）将在加拿大温哥华举行。CVPR（Computer Vision and Pattern Recognition，计算机视觉与模式识别）会议是计算机视觉与模式识别、人工智能领域的国际顶级会议，是中国计算机学会（CCF）推荐的A类国际学术会议。本届会议录用率为23.6%。

来自IT University of Copenhagen给出了《边缘人工智能》教程，值得关注！CVPR 2024 教程：视角基础模型的最新进展在不同粒度级别上理解视觉信息一直是计算机视觉社区的长期问题。这些任务范围从图像级任务（例如，图像分类、图像-文本检索、图像描述和视觉问答）、区域级定位任务（例如，目标检测和短语定位）到像素级分组任务（例如，图像实例/语义/全景分割）。直到最近，这些任务大多通过专门的模型设计分别解决，这阻碍了跨不同粒度任务的协同作用的利用。鉴于Transformers的多功能性，并受到大规模视觉-语言预训练的启发，计算机视觉社区现在对构建通用视觉系统（也称为视觉基础模型）越来越感兴趣，这些系统可以从各种下游任务中学习并应用于这些任务，范围从图像级、区域级到像素级视觉任务。在本教程中，我们将介绍学习和应用视觉基础模型前沿的最新方法和原理，

包括：

学习用于多模态理解和生成的视觉基础模型
基准测试和评估视觉基础模型
基于视觉基础模型的代理和其他高级系统

这将涵盖当前在视觉基础模型领域的最新进展和应用，旨在帮助与会者深入理解和掌握这一新兴技术。https://vlp-tutorial.github.io/

成为VIP会员查看完整内容

52

相关内容

CVPR 2024

【CVPR2024教程】新加坡国立等最新《边缘AI实战：开发和部署优化模型的实用方法》教程，附274页ppt

【CVPR2024教程】新加坡国立等最新《边缘AI实战：开发和部署优化模型的实用方法》教程，附274页ppt

专知会员服务

50+阅读 · 2024年6月20日

CVPR2024开会了！新加坡国立等最新《视频扩散模型》教程，附274页ppt

CVPR2024开会了！新加坡国立等最新《视频扩散模型》教程，附274页ppt

专知会员服务

33+阅读 · 2024年6月19日

视觉大模型有何进展？微软CVPR2023最新《视觉基础模型进展》教程，附260页ppt

视觉大模型有何进展？微软CVPR2023最新《视觉基础模型进展》教程，附260页ppt

专知会员服务

117+阅读 · 2023年6月22日

CVPR 2023开会了！SMU谷歌等最新《视觉异常检测》教程，附300多页ppt

CVPR 2023开会了！SMU谷歌等最新《视觉异常检测》教程，附300多页ppt

专知会员服务

69+阅读 · 2023年6月20日

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

专知会员服务

85+阅读 · 2023年6月19日

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

70+阅读 · 2022年4月21日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

【知识图谱】肖仰华：SIGIR 2018、WWW2018知识图谱研究综述

【知识图谱】肖仰华：SIGIR 2018、WWW2018知识图谱研究综述

产业智能官

11+阅读 · 2018年8月21日

【WWW2018】网络表示学习Tutorial（附下载）

【WWW2018】网络表示学习Tutorial（附下载）

专知

12+阅读 · 2018年4月25日

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

A multilevel backbone extraction framework

Arxiv

0+阅读 · 2024年7月29日

Network sampling based inference for subgraph counts and clustering coefficient in a Stochastic Block Model framework with some extensions to a sparse case

Arxiv

0+阅读 · 2024年7月27日

A spatiotemporal deep learning framework for prediction of crack dynamics in heterogeneous solids: efficient mapping of concrete microstructures to its fracture properties

Arxiv

0+阅读 · 2024年7月24日

Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video

Arxiv

0+阅读 · 2024年7月22日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

VIP会员

相关主题

视觉基础模型

相关VIP内容

【CVPR2024教程】新加坡国立等最新《边缘AI实战：开发和部署优化模型的实用方法》教程，附274页ppt

【CVPR2024教程】新加坡国立等最新《边缘AI实战：开发和部署优化模型的实用方法》教程，附274页ppt

专知会员服务

50+阅读 · 2024年6月20日

CVPR2024开会了！新加坡国立等最新《视频扩散模型》教程，附274页ppt

CVPR2024开会了！新加坡国立等最新《视频扩散模型》教程，附274页ppt

专知会员服务

33+阅读 · 2024年6月19日

视觉大模型有何进展？微软CVPR2023最新《视觉基础模型进展》教程，附260页ppt

视觉大模型有何进展？微软CVPR2023最新《视觉基础模型进展》教程，附260页ppt

专知会员服务

117+阅读 · 2023年6月22日

CVPR 2023开会了！SMU谷歌等最新《视觉异常检测》教程，附300多页ppt

CVPR 2023开会了！SMU谷歌等最新《视觉异常检测》教程，附300多页ppt

专知会员服务

69+阅读 · 2023年6月20日

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

CVPR 2023开会了！谷歌等最新《视觉上理解和解释注意力》教程，附152页ppt

专知会员服务

85+阅读 · 2023年6月19日

热门VIP内容

开通专知VIP会员享更多权益服务

大模型推理时代的知识编辑

《利用人工智能对军事行动进行建模》

【MIT博士论文】加速科学发现的因果建模实践算法

机器人、无人机与实时影像：应对城市爆炸威胁的三大技术方案

相关资讯

【干货书】《Transformers 机器学习:深度探究》，284页pdf

【干货书】《Transformers 机器学习:深度探究》，284页pdf

专知

70+阅读 · 2022年4月21日

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

台大李宏毅：生成式对抗网络GAN在语音自然语言处理中的应用|附247页PPT下载

新智元

18+阅读 · 2019年9月22日

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

【CVPR2019最新图结构教程】基于图结构网络的表征学习（附下载）

专知

38+阅读 · 2019年6月18日

【知识图谱】肖仰华：SIGIR 2018、WWW2018知识图谱研究综述

【知识图谱】肖仰华：SIGIR 2018、WWW2018知识图谱研究综述

产业智能官

11+阅读 · 2018年8月21日

【WWW2018】网络表示学习Tutorial（附下载）

【WWW2018】网络表示学习Tutorial（附下载）

专知

12+阅读 · 2018年4月25日

相关基金

第七届全国数学文化论坛

国家自然科学基金

3+阅读 · 2016年12月31日

数据驱动的人体图像语义分割研究

国家自然科学基金

4+阅读 · 2014年12月31日

Biot模型基于有限元离散的多重网格算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

海量Web用户生成内容物化关键技术

国家自然科学基金

2+阅读 · 2014年12月31日

基于UGC的应急响应决策支持系统关键技术研究

国家自然科学基金

13+阅读 · 2014年12月31日

相关论文

A multilevel backbone extraction framework

Arxiv

0+阅读 · 2024年7月29日

Network sampling based inference for subgraph counts and clustering coefficient in a Stochastic Block Model framework with some extensions to a sparse case

Arxiv

0+阅读 · 2024年7月27日

A spatiotemporal deep learning framework for prediction of crack dynamics in heterogeneous solids: efficient mapping of concrete microstructures to its fracture properties

Arxiv

0+阅读 · 2024年7月24日

Disentangling spatio-temporal knowledge for weakly supervised object detection and segmentation in surgical video

Arxiv

0+阅读 · 2024年7月22日

A Survey of Large Language Models

A Survey of Large Language Models

Arxiv

494+阅读 · 2023年3月31日

微信扫码咨询专知VIP会员