6 月 17 日至 21 日,计算机视觉领域顶级盛会之一国际计算机视觉与模式识别会议(CVPR 2024)将在加拿大温哥华举行。CVPR(Computer Vision and Pattern Recognition,计算机视觉与模式识别)会议是计算机视觉与模式识别、人工智能领域的国际顶级会议,是中国计算机学会(CCF)推荐的A类国际学术会议。本届会议录用率为23.6%。
来自IT University of Copenhagen给出了《边缘人工智能》教程,值得关注!CVPR 2024 教程:视角基础模型的最新进展在不同粒度级别上理解视觉信息一直是计算机视觉社区的长期问题。这些任务范围从图像级任务(例如,图像分类、图像-文本检索、图像描述和视觉问答)、区域级定位任务(例如,目标检测和短语定位)到像素级分组任务(例如,图像实例/语义/全景分割)。直到最近,这些任务大多通过专门的模型设计分别解决,这阻碍了跨不同粒度任务的协同作用的利用。鉴于Transformers的多功能性,并受到大规模视觉-语言预训练的启发,计算机视觉社区现在对构建通用视觉系统(也称为视觉基础模型)越来越感兴趣,这些系统可以从各种下游任务中学习并应用于这些任务,范围从图像级、区域级到像素级视觉任务。在本教程中,我们将介绍学习和应用视觉基础模型前沿的最新方法和原理,
包括:
学习用于多模态理解和生成的视觉基础模型
基准测试和评估视觉基础模型
基于视觉基础模型的代理和其他高级系统
这将涵盖当前在视觉基础模型领域的最新进展和应用,旨在帮助与会者深入理解和掌握这一新兴技术。https://vlp-tutorial.github.io/