年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势（上）

会员服务 ·

年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势（上）

2022 年 2 月 1 日 机器之心

机器之心报道

机器之心Pro & SOTA！模型

仵冀颖，机器之心分析师网络

本文节选自机器之心《2021-2022年度 AI科技发展趋势报告 · 研究篇》，详细数据及分析过程在完整报告中进行收录。报告将于2022年开春正式发布，点击阅读原文获得免费获取报告机会。

机器学习算法的演进是人工智能技术发展的核心要素。

在本文的上篇，我们尝试分别从机器学习算法、计算语言处理、计算机视觉及机器人分领域对ML算法发展趋势进行总结。在本文的下篇，我们尝试打破领域的边界，形成一份全局性的总结。本文仅选取分析结论部分，详细数据及分析过程将收录在《2021-2022年度 AI科技发展趋势报告》完整版中。

2021年机器学习四大顶会

AAAI、NeurIPS、ICML、IJCAI

接收论文综合分析观察

首先，在2021年主要的四个机器学习会议中，机器学习、计算机视觉、NLP仍然是投稿量和接收量最大的几个主题。对于从事机器学习、人工智能相关领域研究的研究人员来说，对于研究论文题目或摘要中涉及“Machine Learning”、“Computer Vision”、“NLP”等会格外关注。但从几个会议最终接收的论文来看，直接用这些命名的论文接收率并不高，可能因为名称过于宽泛，反而不能够突出论文工作的重点。

其次，引入随机方法、优化方法、博弈论、增强处理、蒸馏等技术的论文虽然总数不是特别多，但接收率在几大会议中普遍较高。这一方面说明，这几个技术是机器学习领域中的热门技术，越来越多的研究人员会在不同领域的机器学习方法中引入这些技术。另一方面也说明，这几项技术应用在机器学习领域中具有较好的效果，包括图像、视频、语音、对话生成、文本翻译等等。

第三，Transformer、图结构、强化学习仍然是机器学习方法中重点采用的技术，在几大会议的最终接收的论文中，应用这几项技术的论文数量都比较多。但是，与GAN直接相关的论文数量与前几年相比大大减少，这也说明GAN在机器学习中的应用进入了瓶颈期。

第四，应对标注的高质量数据较少的问题的少样本/弱样本/零样本学习相关文章的数量与前几年相比变化不大，说明聚焦于这一方向的研究人员仍在推进相关工作，并在不同领域中应用获得了不错的效果。但这一类方法并没有根本性的改进，所以也没有实现论文数量方面的大的改变。

第五，在关于智能体的论文中，今年最终接收的文章都以multi-agent为主，与单agent的方法不同，multi-agent侧重于多个agent之间的规划调度问题，以及对智能体与智能体、智能体与环境之间的相互影响和作用（即适应性）的分析。

第六，在几个会议中都有关于可解释性、伦理、偏见等的论文，可以看出，越来越多的研究人员开始关注这一类AI引发的社会问题。此外，越来越多的研究人员开始关注机器学习模型的可解释性问题，从简单的提高识别率、准确率逐渐提升到关注模型有效性背后真实原因的阶段。经历了努力利用黑盒机器学习模型改进不同领域中应用效果的阶段，现在的机器学习发展到了深入理解白盒模型机理的阶段。

计算语言处理会议（ACL）接受论文分析观察

首先，从ACL 2021年会议论文和近年来计算语言处理领域的研究论文可以看出，与其它AI相关的研究领域相比，计算语言处理领域中已有很多技术/算法/模型应用在实际场景中，所以与前几年追求准确率相比，近年来的论文更多关注模型的可解释性、泛化性以及社会性问题，同时也有越来越多的研究人员关注由此产生的伦理问题、垄断问题。

其次，word embedding仍然是各类NLP文章中最关注的技术和方法，说明这一技术在计算语言处理领域中适用性、有效性仍然是最优的。

第三，在计算语言处理领域中迁移能力仍然不乐观。计算语言处理领域中所谓的in-domain如何界定？目前英语的各类NLP模型直接迁移应用到其它语言中效果不佳。

第四，预训练语言模型在ACL 2021 的文章中几乎呈现了压倒性的优势，包括BERT、RoBERTa、BART、GPT-2等。这是计算语言处理会议与其它顶会最大的不同。预训练可能是其它领域中某些情况下可选的技术方案，但是却是计算语言处理领域中的绝对最优技术方案之一。不管是字节跳动还是百度，在ACL 2021上都公布了成绩非常出色的预训练语言模型。

第五，ACL 2021上共有57个国家投稿，其中投稿数前二国家是中国（37.6%）和美国（25.1%），其中中国投稿量是美国的1.5倍之多。这也说明中国的计算语言处理技术处于领先的地位，而国内专注于此领域的研究人员也较多。

计算机视觉（CVPR、ICCV）接受论文分析观察

首先，在计算机视觉领域，传统的图像和视频理解、目标检测等仍然是研究的热门。以2D/3D目标检测为例，监督/半监督方法、少样本学习等方法都有所应用。在两个主要会议中，这几个经典领域中论文的研究主要从不同的应用场景中面临的不同问题、改进方法/模型以及构建更加鲁棒的数据库这些角度入手。

第二，与NLP领域中预训练模型带来的巨大改进不同，计算机视觉领域中虽然也在不断提出和应用算法/模型，但最终性能的改进主要是归因于数据集的持续升级。纵观顶会的相关论文，没有哪一种技术、算法能够在某一个计算机视觉领域中获得压倒性的优势。更多的优势方法得益于算力/数据的优势。

第三，深度神经网络、卷积网络带来了计算机视觉领域基础任务的性能突破，GAN 的提出进一步带来了分类和鉴别的性能突破。在2021年会议论文中，神经网络架构改进（包括Transformer和GNN）、GAN的应用等仍是主要的方向。

第四，在计算机视觉领域中，关于可解释性、公平、透明、伦理等问题的文章数量也不少，说明计算机视觉领域的研究人员也开始关注这一问题。

第五，由于计算机视觉任务极易受到对抗样本的影响，与NLP等应用领域相比，在计算机视觉领域中关于对抗学习的论文数量也较多。

最后，在两个计算机视觉顶会中，都有大量关注于数据库构建的文章。在一些专门的应用领域，例如3D城市点云、游戏场景、恶意攻击场景等，计算机视觉方法的适用性还依赖于专门的标注数据库的构建。

机器人（ICRA、CoRL）接受论文分析观察

首先，2021年机器人领域的顶会中大量论文都聚焦于无模型强化学习框架，令智能体与环境进行实时交互，以实现收敛得到最优解。这表明，越来越多的研究人员考虑使用无模型框架替代传统的使用拟合模型的经典强化学习方法。

第二，CoRL中感知领域的方法成为研究热点，感知领域的方法则是认知科学、神经科学等学科在机器人领域中的应用，其根本目的是令智能体像人一样能够通过各种视觉、触觉的经验学习。ICRA中的感知相关论文数量也远超强化学习等主题，成为了算法/方法类关注度最高的主题。

第三，与其它顶会不同，机器人领域的顶会更多的关注机器人在实际应用场景中的性能，如野外机器人、医学相关机器人、服务机器人等，而在相关会议中的Demo更多的代表了机器人领域中的研究趋势，例如大量采用无模型框架、引入感知技术等等。

机器之心《2021-2022年度 AI科技发展趋势报告》结合文献研究、数据挖掘、专家访谈及市场调查等多种分析方法，系统地从学术突破、工程发展、产业融合及社会宏观四个维度对2021年AI技术发展情况进行回顾性分析，对2022年度AI科技发展趋势进行展望。

报告将于2022年开春正式发布，点击阅读原文获得免费获取报告机会。

转载请联系本公众号获得授权

投稿或寻求报道：content@jiqizhixin.com

登录查看更多

知识荟萃

精品入门和进阶教程、论文和代码整理等

查看相关VIP内容、论文、资讯等

NeurIPS 20201接收论文列表发布，2334篇论文都在这了！

专知会员服务

38+阅读 · 2021年11月4日

近期必读的5篇顶会SIGIR 2021【反事实推理】相关论文和代码

专知会员服务

23+阅读 · 2021年7月25日

近期必读的6篇顶会CVPR 2021【对抗攻击】相关论文和代码

专知会员服务

51+阅读 · 2021年7月10日

近期必读的5篇顶会CVPR 2021【对比学习（CL）】相关论文和代码

专知会员服务

45+阅读 · 2021年5月14日

近期必读的5篇顶会CVPR 2021【图像分类】相关论文和代码

专知会员服务

80+阅读 · 2021年4月7日

2020->2021必看的十篇「深度学习领域综述」论文

专知会员服务

136+阅读 · 2021年1月1日

近期必读的七篇NeurIPS 2020【对比学习】相关论文和代码

专知会员服务

66+阅读 · 2020年10月20日

自然语言处理中深度学习模型对抗性攻击综述，41页pdf论文

专知会员服务

63+阅读 · 2020年4月19日

近期必读的5篇AI顶会CVPR 2020 GNN (图神经网络) 相关论文

专知会员服务

79+阅读 · 2020年3月3日

【重磅】斯坦福《2019人工智能指数报告》出炉，291页pdf了解AI态势进展

专知会员服务

60+阅读 · 2019年12月12日

2022斯坦福AI指数报告出炉！中国霸榜AI顶会，但引用量最低

THU数据派

1+阅读 · 2022年3月17日

CVPR 2022 接收结果出炉！录用 2067 篇，接收数量上升24%（附最新论文速递）

专知

1+阅读 · 2022年3月2日

CVPR 2022放榜！2067篇论文被接收：提前传播真会被拒

机器之心

2+阅读 · 2022年3月2日

WSDM2022推荐系统论文集锦

机器学习与推荐算法

1+阅读 · 2022年1月19日

会议邀请：微软亚洲研究院2021年度技术回顾

微软研究院AI头条

0+阅读 · 2021年12月27日

2020 年人工智能几个重点领域，顶级国际学术会议分析报告

THU数据派

4+阅读 · 2021年12月13日

Interspeech 2019 回顾 | 从顶会看语音技术的发展趋势

DataFunTalk

11+阅读 · 2020年3月10日

论文投递持续走高，得分3.67仍大概率被拒，一览EMNLP-IJCNLP 2019开幕盛况

AI科技评论

11+阅读 · 2019年11月6日

【领域报告】主动学习年度进展|VALSE2018

深度学习大讲堂

15+阅读 · 2018年6月12日

CVPR 2018 中国论文分享会之「深度学习」

AI科技评论

11+阅读 · 2018年5月27日

基于非独立同分布学习理论的图模型词义消歧及领域适应方法研究

国家自然科学基金

1+阅读 · 2015年12月31日

基于神经网络和群体智能的稀疏表示算法研究

国家自然科学基金

1+阅读 · 2014年12月31日

高维数据下的模型平均方法

国家自然科学基金

6+阅读 · 2014年12月31日

基于迁移学习的脑机接口特征提取和预测方法研究

国家自然科学基金

2+阅读 · 2013年12月31日

组合测试用例的生成及演化技术

国家自然科学基金

1+阅读 · 2013年12月31日

面向微博平台的短文本话题检测与跟踪研究

国家自然科学基金

0+阅读 · 2013年12月31日

基于稀疏编码模型的深层学习神经网络

国家自然科学基金

7+阅读 · 2012年12月31日

半监督文本聚类算法在个性化文本分析上的研究

国家自然科学基金

0+阅读 · 2012年12月31日

图像压缩感知与图像加密融合算法研究

国家自然科学基金

0+阅读 · 2012年12月31日

基于图的统计机器翻译方法研究

国家自然科学基金

2+阅读 · 2010年12月31日

User-Centric Conversational Recommendation with Multi-Aspect User Modeling

Arxiv

0+阅读 · 2022年4月20日

DAME: Domain Adaptation for Matching Entities

Arxiv

2+阅读 · 2022年4月20日

FairFed: Enabling Group Fairness in Federated Learning

Arxiv

0+阅读 · 2022年4月18日

Transfer Learning for Electricity Price Forecasting

Arxiv

3+阅读 · 2022年4月18日

Domain Generalization in Vision: A Survey

Arxiv

16+阅读 · 2021年7月18日

Pay Attention to MLPs

Arxiv

28+阅读 · 2021年5月17日

Generalizing to Unseen Domains: A Survey on Domain Generalization

Arxiv

30+阅读 · 2021年3月10日

Transfer Learning in Deep Reinforcement Learning: A Survey

Arxiv

23+阅读 · 2020年9月16日

Machine Learning: Basic Principles

Arxiv

26+阅读 · 2018年8月19日

Explainable Recommendation: A Survey and New Perspectives

Arxiv

11+阅读 · 2018年5月13日

VIP会员

年度回顾 | 从九大国际AI顶会接收论文一窥ML算法趋势（上）

相关内容

知识荟萃

更多