第33届国际人工智能大会于1月27日至2月1日在夏威夷檀香山举行。本届会议投稿量较去年增长了近90%,录用率仅为16.2%,中国的投稿数量共计2419篇,位居全球第一。CCF常务理事、南京大学的周志华教授担任程序委员会主席之一。
关键词:
AAAI人工智能对抗机器学习智能城市
中国猪年春节前,第33届国际人工智能大会 (Association for the Advancement of Artificial Intelligence, AAAI) 于1月27日至2月1日在夏威夷檀香山举行。在“AI寒冬”流言再起之际,本届会议的氛围却在夏威夷温暖的气温中依旧高涨。
创造历史与变革
本届会议收到7095篇有效投稿,投稿量较去年增长了近90%。巨大的投稿量对审稿的公平性和组织的有序性提出了极大的挑战。值得一提的是,南京大学的周志华教授担任程序委员会主席之一,他是AAAI有史以来第一位华人程序委员会主席。在程序委员会主席、89位领域主席和3450位审稿人的共同努力下,1147篇论文被录用,录用率仅为16.2%,较去年降低了30%。录用数量之大和录用率之低均创造了历史之最。
在数量庞大的论文的“狂轰乱炸”下,本届会议从审稿到组织上均发生了改变,保障了审稿过程的公平有序。从审稿人挑选待审论文开始,将往年每个审稿人均能看到所有论文的方式,改为每个审稿人仅能从与自己领域相关的约150篇论文中挑选,高级审稿人也只能看到300篇左右的论文,此变革有效避免了“熟人审熟人”现象的出现。本次会议还引入了更为严格的双盲审制度,不仅审稿人与投稿人互盲,而且对于同一篇论文,审稿人之间、审稿人和高级程序委员、审稿人和领域主席也均为互盲。本届会议的拒稿流程也极其谨慎,只要高级程序委员、领域主席和程序委员会主席中有一人对论文存在异议,则该论文都将交于他人重新评议。
从审稿意见上看,本次会议共收到18191条审稿意见,超过95% 的论文至少收到三条审稿意见,平均每一条审稿意见有1250.9个词。其中有3056条审稿意见超过2000词,有219条审稿意见超过5000词,有14条审稿意见超过了10000词。
从投稿地区上看,中国的投稿数量共计2419篇,位居全球第一,在数量上几乎比第二名的美国(1280篇)多出一倍。中国被录用的论文数量也是全球第一,共计382篇,比第二名的美国多出114篇,虽然中国论文的录用率(15.8%)要逊色于美国(20.6%) 等其他国家,但是中国学者在AI领域的参与度创造了历史之最。
在会议组织上,也一改往年由大会决定论文展示方式的规定,而是根据论文作者的意愿决定展示方案,最终有460篇论文被选为口头报告展示,所有的论文均有墙报展示。
盛会热点
从投稿内容上看,机器学习、自然语言处理和计算机视觉占总投稿量的61%、占总录取量的59%,成为最火热的三大AI子领域(见图1)。结合大会进程中学者讨论的内容,对抗学习和智能城市成为大家极其关注的热点。
对抗机器学习
近年来,对抗机器学习凭借其在诸多领域的广泛应用和出色表现,吸引了许多研究人员的注意,成为大会热点中的热点。生成对抗网络(GANs)的提出者、谷歌大脑的高级研究员伊恩·古德费洛(Ian Goodfellow)作了题为“Adversarial Machine Learning”的特邀报告,将对抗机器学习的讨论推向了高潮。
与传统的机器学习问题仅将一个损失函数最小化不同的是,对抗学习的目标是将对手的最大奖赏最小化。此种情境在很多学习问题中均有出现,古德费洛等人提出的生成式模型就是一个很好的例子。在生成式模型中,生成器被用于产生假的样本,判别器的任务是将假的样本分辨出来。生成器的目标是生成尽可能迷惑判别器的样本,判别器的目标是尽可能将生成的样本与真实样本区分开,两者构成了一组对抗的学习模式。随着生成器和判别器相互迭代的训练,它们的能力均被增强。最终,生成器生成的样本足以以假乱真。古德费洛在特邀报告中指出,这样的技术已经广泛用于图片及视频的风格迁移、姿态提取、特征替换等方面的工作,生成的图像清晰度和逼真程度都远远超越了之前所有的方法,未来的应用前景十分广阔。
近期机器学习算法的安全性和鲁棒性也受到研究者的极大关注。例如,对一张置信度超过50%的熊猫照片,稍微加入一些肉眼无法察觉的噪声,即可让已经训练好的分类器模型以99%的概率错判为长臂猿。类似这样的情况在许多模型中都会存在,这就使得如何提高模型的安全性成为一个非常重要的研究方向。古德费洛在特邀报告中指出,对抗机器学习的技术能够为提高学习算法的鲁棒性和安全性发挥关键作用。同生成式模型的思想,既然模型不够安全,那么就使用生成器产生出最容易让模型犯错的噪声。判别器则为模型本身判别带噪音的样本和真实样本。通过不断地迭代训练,模型的安全性或者鲁棒性将会得到极大的提高。
对抗学习的广泛使用得益于如今很多现实的机器学习场景天然的对抗模式,如生成式模型的生成器和判别器设定,对抗博弈问题中的对手设定等。对抗学习的对抗机制合理地引入自监督信息,很好地解决了监督学习问题中标记样本不足的问题,使得大量无监督样本能够被学习器利用,提高了样本的利用率,从而使学习器获得更好的效果。
智能城市
城市的高速发展使我们的生活变得更加美好,但同时也带来了交通拥挤、能源消耗、空气污染等问题。由于这些问题的高度耦合性,使得问题很难得到根治。如今成熟的云计算技术、多样的海量数据以及有效的机器学习算法使得解决这些问题成为了可能,智能城市也成为近年来的热点话题之一。
本届会议上,京东集团的郑宇教授在题为“Urban Computing: Building Intelligent Cities Using Big Data and AI”的报告中提出使用四层架构构建智能城市,即城市感知、城市数据存储、城市数据分析、服务供给。这四层架构不是相互独立的,而是形成闭环,即通过数据分析完成城市升级后,仍然能够不断地收集数据,为城市提供后续改进方案。
他用数个例子说明四层架构在智能城市构建中起到的重要作用。例如,通过分析共享自行车的轨迹数据来检测机动车的违章停车。因为自行车在正常行驶中通常是一条直线,而当有违章停车时,自行车就会产生绕行的轨迹。这些轨迹数据在同一时间同一地点反复出现时,则极有可能有违章停车行为的存在。此种检测看似简单,但是需要四层架构配合才能产生最终的效果。在城市感知层,通过共享自行车所携带的传感器获取行车轨迹信息,然后对存储的信息进行分析,发现疑似违章停车行为,反馈给有关部门进行整治。此类技术的大规模使用将大量减少城市中的违章停车现象。
大会奖项
本届会议颁发了最佳论文奖、最佳论文提名奖、最佳学生论文奖、经典论文奖等奖项,部分内容见表1。
展望
本届AAAI创造纪录的投稿数量注定了此次大会的不平凡,AI持续火热的态势吸引着越来越多的学者。不仅仅是AI学者,其他领域的学者也在对AI及其交叉领域的发展作出贡献。大会的热点也从单纯的AI技术推进到产业落地,使用AI技术改善人们的生活是AI最终的落地点。
作者介绍
胡毅奇
南京大学博士研究生。主要研究方向为机器学习、自动机器学习、非梯度优化。
huyq@lamda.nju.edu.cn
作者介绍
庞振家
南京大学硕士研究生。主要研究方向为机器学习、强化学习。
pangzj@lamda.nju.edu.cn
CCF推荐
【精品文章】
点击“阅读原文”,前往CCF数图相关栏目。