2022 年初,我们对 2021 年度发布于 arXiv 的「SOTA」AI 论文进行了一轮分析,试图找到 2021 年度,对 AI 开发者最具价值的「Pop SOTA!」工作。
但面对超过 2 万篇的「SOTA」工作,我们产生了疑惑 —— 自称「SOTA」的工作就一定是先进的吗?对广大 AI 开发者来说,什么样才是先进的技术工作?是思路具有启发性?还是跑出的实验分数高?是易于实现,对数据资源、计算资源的需求可控?还是放出的代码实现即插即用,可用性强?
#1 DeepMind 开源 AlphaFold2,预测出 98.5% 的人类蛋白质结构
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
20 |
6.88 |
14.18 |
3.27 |
19.85 |
64.18 |
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
2.794 |
6.17 |
17.45 |
16.36 |
14.31 |
57.09 |
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
6.78 |
5.34 |
15.52 |
9.65 |
17.75 |
55.04 |
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
0.146 |
0 |
20 |
20 |
14.54 |
54.69 |
论文地址:https://arxiv.org/abs/2011.12100
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
12.54 |
1.81 |
17.73 |
7.27 |
15 |
54.34 |
论文地址:https://arxiv.org/abs/2111.06377
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
3.652 |
16.31 |
10.9 |
15 |
8.08 |
53.94 |
项目地址:https://github.com/babysor/MockingBird
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
0.51 |
1.09 |
18.18 |
18.18 |
15.39 |
53.35 |
论文地址:https://arxiv.org/abs/2101.04407
工作价值性认可度 |
工作可用性认可度 |
总分值 |
|||
工作影响力范围 |
官方实现认可度 |
工作引领性 |
工作启发性 |
应用可行性 |
|
7.74 |
0 |
15.45 |
12.73 |
16.92 |
52.85 |
项目地址:http://gaugan.org/gaugan2/
「Percy Liang、李飞飞等 100 多位研究者系统阐述了大规模预训练模型背后的机遇与风险,并统一给这些模型取名为 Foundation Model」
「MIT 新研究为逼近矩阵乘法任务引入了一种基于学习的算法,运行速度是精确矩阵乘积的 100 倍,是当前近似方法的 10 倍」
「Facebook 科学家 Sho Yaida 撰书从第一性原理解释深度神经网络,LeCun 表示这是首批致力于深度学习理论的书」
2021年度技术工作 |
预选评价后分值排序 |
社区评价后分值排序 |
DeepMind 开源 AlphaFold2,预测出 98.5% 的人类蛋白质结构 |
1 |
1 |
何恺明一作论文提出 Masked Autoencoders(MAE),可用作计算机视觉的可扩展自监督学习器 |
2 |
5 |
Percy Liang、李飞飞等 100 多位研究者系统阐述了大规模预训练模型背后的机遇与风险,并统一给这些模型取名为 Foundation Model |
3 |
152 |
微软亚洲研究院提出 Swin Transformer,在 COCO 等数据集上超越 CNN |
4 |
2 |
MIT 新研究为逼近矩阵乘法任务引入了一种基于学习的算法,运行速度是精确矩阵乘积的 100 倍,是当前近似方法的 10 倍 |
5 |
29 |
谷歌推出 1.6 万亿参数语言模型 Switch Transformer,预训练速度最高可达 T5 的 7 倍 |
6 |
138 |
Facebook 科学家 Sho Yaida 撰书从第一性原理解释深度神经网络,LeCun 表示这是首批致力于深度学习理论的书 |
7 |
47 |
谷歌大脑推出结合卷积和注意力的新模型 CoAtNet,模型具有更强的学习和泛化能力 |
8 |
99 |
Where - 这些工作来自哪些国家?分布情况怎么样?
Who - 主要由哪些机构贡献的这些价值性工作?与顶会的分布是否一样?
How - 这些工作分别是如何为社区带来的价值?不同类型的工作比例如何?
What - 不同类别的 Top 价值工作分别是哪些?
我们基于每一项技术工作核心团队的主要人员所在机构归属国家对技术进展的来源地进行标注,得到以下统计。需要注意的是,在排名前 128 位的工作中,美国、中国的工作占据了绝大部分,其中有 5 项工作是中美合作的。
以下为在「新模型」、「新实现」、「新思路」、「新工具」、「新数据集」各细分类别下总分排序获得 TOP3 的工作汇总,总计 9 个:
技术工作 |
新模型 |
新实现 |
新思路 |
新工具 |
新数据集 |
DeepMind 开源 AlphaFold2,预测出 98.5% 的人类蛋白质结构 |
Y |
Y |
Y |
- |
- |
微软亚洲研究院提出 Swin Transformer,在 COCO 等数据集上超越 CNN |
Y |
Y |
Y |
- |
- |
OpenAI 发布 CLIP,支持文本图像跨模态检索,可用于查找最能代表图像的文本片段,或查找给定文本查询的最合适图像 |
Y |
Y |
Y |
- |
- |
GitHub 用户 babysor 发布语音克隆项目 MockingBird |
- |
- |
- |
Y |
- |
京东开源 PyTorch 人脸识别工具包 FaceX-Zoo,覆盖最强模型 |
- |
- |
- |
Y |
- |
上海交大开源多智能体并行训练框架 MALib,支持大规模基于种群的多智能体强化学习训练 |
- |
- |
- |
Y |
- |
OpenAI 公开 GitHub Copilot 背后代码生成模型 Codex 论文及数据集 HumanEval |
Y |
- |
- |
- |
Y |
MIT、微软推出编程挑战题库数据集,可用于教 AI 编程并评估 AI 的编程能力 |
- |
- |
- |
- |
Y |
Facebook 提出 TextStyleBrush,可模仿用户笔迹 |
- |
- |
- |
- |
Y |
我们还统计了前 128 工作和所有 256 个工作在 GitHub 上获得 Star 的数量。我们惊讶地发现,尽管一些工作没有官方实现,前 128 个工作平均 GitHub 数量接近 1500 Star,所有 256 个工作的平均 Star 数也接近 1000 Star。
Github Star 总量 |
每个工作平均 GitHub Star |
|
TOP 128 工作 |
191299 |
1494.5 |
TOP 256 工作 |
249278 |
973.7 |
本次形成有效工作评价的人数共有 103 人。参与评价的贡献者以职算法工程师 / 算法科学(34%)、在校学生(本科 / 硕士)(31%)、在职高校博士研究生 / 博后(15%)为主。其余评价参与者的身份为在职高校教授、在职工程师和在职技术高管。
一些技术工作并没有实际解决问题,噱头大于价值
一些技术工作确实有一定的工程贡献,但并无实质性的创新
一些技术工作的类似工作也有很多,缺少和其他工作的比较
领域综述性工作
工具类技术工作
工程优化型工作
提出的模型设想,但尚未形成详细设计及实现的工作
提交时间 |
技术工作 |
工作类型 |
2022-01-19 13:04:31 |
北大团队自研AI框架“河图”(Hetu)正式开源 |
新工具 |
2022-01-19 15:31:00 |
微软亚洲研究院提出 Graphormer,获得了 KDD 2021 图神经网络比赛冠军,以及 Open Catalyst Challenge 比赛冠军,被 MILA 的研究员称为:赢得了Graph ML 领域 2021 年大满贯。开源的 Graphormer 工具包支持通用的分子建模,为 MSRA 在交叉学科领域第一个开源工具包。 |
新模型;新实现;新工具 |
2022-01-20 14:44:41 |
开源云原生神经搜索框架 Jina,新工具 |
新工具; 新思路; 新实现 |
2022-01-21 23:21:43 |
RepVGG,是清华和旷视提出的极简卷积网络基本模型。官方GitHub(https://github.com/DingXiaoH/RepVGG)已经得到2200stars,是同届 CVPR 的前几名。曾得到 Andrej Karpathy 推荐。RepVGG论文中提出的结构重参数化方法论是一种新的基本理论和基本方法论。 |
新思路; 新模型; 新工具 |
2022-01-23 13:39:13 |
微软亚洲研究院所发表的 TAPEX 是一个全新的表格预训练思路。以前的表格预训练方法通常都需要爬取网页获得大规模语料,而 TAPEX 的预训练语料是合成的数据。仅通过在合成数据上进行继续预训练,该模型在四个非常有名的表格问答数据集上取得了比 Google/Facebook 等知名机构最先进的预训练模型好 4 到 5 个点的效果。目前该论文也已高分被 ICLR 2022 接收。 |
新思路; 新实现 |
2022-01-24 01:06:41 |
浙江大学、阿里巴巴达摩院提出文档级关系抽签模型 Docunet |
新思路; 新模型 |
2022-01-24 01:09:12 |
浙江大学、阿里巴巴发布自动化细粒粒度概念知识图谱 AliCG |
新思路; 新数据集; 新实现 |
2022-01-24 19:46:45 |
北航和加拿大渥太华大学的学者提出了模型参数对抗扰动算法 AMP。该算法具有严谨的理论依据,并可以被证明其更偏好平坦的损失函数局部最优解。在 CIFAR10,CIFAR100 和 SVHN等图像数据集上取得了比 Mixup、Dropout 等正则化方法更高的分类准确率。 |
新思路 |
2022-01-25 14:29:58 |
快手提出用于任意风格化人脸生成的 BlendGAN,可以根据单张参考风格图或随机风格采样实现任意风格的自然人脸-风格化人脸图像对的生成,同时提出了高清艺术化人像数据集 AAHQ |
新模型; 新实现; 新数据集 |