在短短几分钟,朋友圈已经被 CVPR 2022 论文接收结果公布的消息刷屏。
作为人工智能领域的顶级会议,CVPR 每年都会吸引大量研究机构和高校参会,投稿量在去年 11 月临近 deadline 时迅速超过了一万——上届 CVPR 2021 的有效投稿数还「仅有」7500 篇。创新高的投稿数引发了审稿压力,截止 1 月 25 日,共有 6427 位审稿人给出了 25801 个评审意见,包括 2104 位紧急审稿人的 3066 个紧急评审意见。
今天上午,CVPR 官方放出了今年大会接收的论文 ID。机器之心统计,有 2067 篇论文被接收。
论文接收 ID 列表:
https://drive.google.com/file/d/15JFhfPboKdUcIH9LdbCMUFmGq_JhaxhC/view
在 meta review 之后,本届的最终论文接收结果将在一到两天后公布。
在欢呼并开始自我宣传的同时,也有人第一时间进行了本届接收论文的统计分析,看起来越早提交论文越好:
显然,越早提交的同学,通常研究完成度较高,没有赶 deadline 时的仓促。
早在去年 10 月,CVPR 官方就发布了重要通知:按照计划,从 2021 年 10 月 19 日到 2022 年 3 月 2 日为社交媒体静默期。在此期间,任何由作者主动发起的对论文的社交媒体宣传都被视为违反政策。
今天结果发下来,确实也有因为自行宣传投稿而被拒的情况出现。有论文作者在社交软件上表示,之前自己组里学生三个 weak accept 的工作 做了宣传页,并把 demo 上传了 YouTube,结果一封拒信发来:
这项规定的宗旨是解决同行评审过程中,因为作者机构被曝光后产生的偏见问题,虽然有人(比如 AI 先驱 Yann LeCun)表示反对,认为会影响前沿技术的传播速度,但目前看来 CVPR 会方执行得非常严格。
不过需注意,把论文发到预印版论文平台 arXiv 上,再用推特转发链接,或者是其他人在讨论,都是不违反规定的。
最大悬念:Masked Autoencoders 能否夺得最佳论文?
当时社交网络上就有一些讨论表示,这篇论文说不定能「预定」CVPR 2022 的最佳。一方面是因为 MAE 研究的确是按照 CVPR 格式上传的,同时也是因为 Masked Autoencoders 确实是一项很有质量的工作。这篇论文也是在太平洋时间 11 月 16 日的 CVPR 2022 论文提交截止时间之前上传的。
论文链接:https://arxiv.org/abs/2111.06377
这篇论文展示了一种被称为掩蔽自编码器(masked autoencoders,MAE)的新方法,可以用作计算机视觉的可扩展自监督学习器。MAE 基于两个核心理念:研究人员开发了一个非对称编码器 - 解码器架构,其中一个编码器只对可见的 patch 子集进行操作(没有掩蔽 token),另一个简单解码器可以从潜在表征和掩蔽 token 重建原始图像。
研究人员进一步发现,掩蔽大部分输入图像(例如 75%)会产生重要且有意义的自监督任务。结合这两种设计,我们就能高效地训练大型模型:提升训练速度至 3 倍或更多,并提高准确性。
作者认为,这种可扩展方法允许学习泛化良好的高容量模型:例如在仅使用 ImageNet-1K 数据的方法中,vanilla ViT-Huge 模型实现了最佳准确率 (87.8%)。在下游任务中的传输性能优于有监督的预训练,并显示出可观的扩展能力。
Masked Autoencoders 提出了一种泛化性能良好的计算机视觉识别模型,有望为 CV 的大模型带来新方向,被寄予「获得最佳论文」的厚望也在情理之中。但获奖对于何恺明应该不是最重要的事,毕竟他已经多次获得 CVPR 奖项:包括 2009 年 CVPR 的 Best Paper,2016 年又获 Best Paper。
时隔六年,恺明大神会再度摘得最佳论文奖吗?一切都是悬念。
© THE END
转载请联系本公众号获得授权
投稿或寻求报道:content@jiqizhixin.com