欧洲计算机视觉会议(European Conference on Computer Vision, ECCV)是欧洲计算机视觉协会(ECVA)主办的计算机视觉和机器学习领域两年一度的顶级研究会议。第18届ECCV会议将于2024年9月29日至10月4日在意大利米兰举行。在ECCV 2024会议中,我们诚邀提交关于多模态智能体(MMAs)的论文。多模态智能体是一个充满活力的领域,致力于通过解读多模态感官输入,在各种环境中生成有效的行为。大型语言模型(LLMs)和视觉-语言模型(VLMs)的崛起在该领域带来了显著进展,影响了从基础研究到实际应用的广泛领域。我们的研讨会将深入探讨这些进展如何与传统的领域特定技术(如视觉问答和视觉-语言导航)相结合。我们特别欢迎以下方向的研究贡献: