Call for Papers
International Journal of Computer Vision (IJCV)
Special Issue on The Promises and Dangers of Large Vision Models
在过去十年里,深度学习彻底颠覆了计算机视觉领域,在许多视觉计算问题上带来了巨大的突破。最近我们观察到另一种趋势在社区里受到了广泛的关注和研究,即视觉模型的扩展,从长远来看可能会对该领域产生重大的影响。
具体来说,视觉模型的大小从几千万参数成倍增长到几亿,甚至几十亿,尤其是在 Vision Transformer 出现之后。此外,训练数据的规模和多样性也随着模型容量的增长而急剧增加,不仅表现在数量上,也表现在形式上(例如结合图像和语言)。在这里,为了简洁起见,我们将此类模型称为大视觉模型 (Large Vision Models or LVMs),其中包括单模态视觉模型和多模态视觉模型(例如视觉语言模型)。
一方面,从大规模数据中学习的 LVMs 在泛化方面表现出强大的能力:它们可以应对广泛的领域或场景,并且可以轻易适应多种视觉任务,例如图像分类 / 字幕 / 分割、对象 / 关键点检测和深度 / 表面法线估计。此外,多模态 LVMs 还为众多下游零样本推理应用带来了机会,例如开放词汇分类 / 检测 / 分割和图像编辑 / 生成。
另一方面,LVMs 带来了社区需要解决的挑战和风险:训练成本高昂且对环境产生负面影响;LVMs 太大而无法在下游数据集上进行微调;网络数据分布不均可能导致社会偏见(性别和种族)和不平等;LVMs 的常识推理能力仍然落后;等等。
本期特刊寻求对推进 LVMs 的原创性贡献——在开发、评估、适应、应用、理解等方面——并解决 LVMs 所带来的潜在负面影响。其内容应与以下范畴有关(但不限于):
Training or adaptation methods for LVMs
LVM architecture designs (not limited to Transformer-based models)
Visualizing and interpreting LVMs
Emergent capabilities of LVMs
Applications and use cases of LVMs in computer vision
Theoretical insights into LVMs
Generalization and robustness of LVMs
Evaluation, biases, fairness, and safety of LVMs
重点日期:
Full paper submission deadline: March 1st, 2023
Review deadline: April 30th, 2023
Author response deadline: May 26th, 2023
Final notification: June 26th, 2023
Final manuscript submission: July 26th, 2023
客座编辑:
Kaiyang Zhou, Nanyang Technological University, Singapore
Ziwei Liu, Nanyang Technological University, Singapore
Xiaohua Zhai, Google Brain, Switzerland
Chunyuan Li, Microsoft Research, Redmond, US
Kate Saenko, Boston University, US
详情请访问以下网页:https://kaiyangzhou.github.io/assets/cfp_ijcv_lvms.html