来源:ACL
编辑:雅新、舒婷
【新智元导读】ACL 2020最佳论文等奖项出炉!本次共颁发了6个奖项,华人学生斩获了最佳论文和最佳Demo论文,来看看这些论文都出自谁之手吧。
刚刚,ACL 2020颁布了论文方面的奖项,共有1篇最佳论文,2篇最佳论文提名,1篇最佳主题论文,1篇最佳主题论文提名,1篇最佳demo论文,2篇最佳demo论文提名。
今年的最佳论文二作和最佳demo论文一作均为华人学生。最佳主题论文奖颁给来自华盛顿大学和萨尔大学的两位研究者。
ACL 2020是第58届ACL年会,原定于7月5日至10日在美国华盛顿西雅图举行。受疫情影响,今年的自然语言处理领域顶级会议ACL改为线上举行,于当地时间7月5日上正式线上开幕。涵盖了 Paper Q&A Session、Tutorials、Workshops等一系列活动。
今年3月份,ACL 官方公布了今年大会的论文录用结果。本届大会共收到3429篇投稿论文,投稿数量创下了ACL会议新高。去年共收到了2906篇论文。
今年总共接收了778篇论文,其中长论文570篇,短论文208篇,接收率为22.7%,与最近的三次ACL会议相近。其中长论文接收率为25.4%,短论文接收率为17.6%。可见,短论文比长论文更难被接收。
自2017年来ACL的论文接收率
今年提交的论文涉及25个主题,其中有4个新主题:
(括号为每个主题接收的论文数)
4. 盘点我们探索过的领域和我们将要探索的领域(65)
根据论文作者提交的国家的相关统计信息,中美依旧是ACL 的最大输出国,贡献率为64%。而在这两国之中,中国超越美国成为投稿数量最多的国家。中国共提交论文数超过1170篇(包含港澳台),比美国多出了130篇。
2020各地区投稿统计
今年论文接受情况,接受率最高的是以色列(40.9%)、英国(31.1%)、美国(29.4%)、德国(29.3%)。中国只有205篇被接收,比美国少了100篇。
论文获奖情况一览,华人学生斩获最佳论文,最佳Demo论文奖
ACL 2020共设有6个奖项:最佳论文、最佳主题论文、最佳demo论文、最佳论文提名、最佳主题论文提名、最佳demo论文提名
最佳论文:Beyond Accuracy: Behavioral Testing of NLP Models with CheckList.
链接:https://arxiv.org/pdf/2005.04118.pdf
这篇论文受软件工程行为测试原理的启发,主要引入了CheckList,这是一种与任务无关的方法,用于测试NLP模型。CheckList包括一般语言功能和测试类型的矩阵,有助于全面测试构思,以及一个软件工具,用于快速生成大量和多样化的测试用例。作者通过测试三个任务来说明CheckList的效用,识别商业和最先进的模型中的关键故障。在用户研究中,负责商业情绪分析模型的团队在广泛测试的模型中发现了新的和可操作的Bug。在另一个用户研究中,使用CheckList的NLP从业者创建了两倍的测试,并且发现的错误数几乎是没使用它的用户的三倍。
最佳论文一位华人作者是来自华盛顿大学计算机科学博士学位的四年级学生吴彤霜。
吴彤霜曾获得香港科技大学计算机科学与工程专业的学士学位。在大学学习期间,她曾是VisLab的成员。她的共同顾问是来自交互数据实验室的Jeffrey Heer和来自人与AI交互(HAI)实验室的Dan Weld。
她表示,自己对交互式机器学习,人机交互和可视化特别感兴趣。目前,她的工作集中在以人为本的精神下,增强机器学习模型的训练和评估步骤,以使最终用户可以更有效,系统地与他们的模型进行交互。
最佳主题论文:Climbing towards NLU: On Meaning, Form, and Understanding in the Age of Data
链接:https://openreview.net/pdf?id=GKTvAcb12b
这篇论文肯定了大型神经语言模型在许多NLP任务上的成功。同时也指出,这些成功有时会被夸大,认为这些模型可以被描述为一种「理解」或「意义」。在这篇文章中,作者认为,一个只接受形式训练的系统本身是无法学习意义的。作者指出,对形式和意义之间的区别有明确理解,将有助于引导该领域朝着更好的自然语言理解科学方向发展。
最佳Demo论文:GAIA: A Fine-grained Multimedia Knowledge Extraction System
https://www.aclweb.org/anthology/2020.acl-demos.11/
这篇论文展示了第一个全面的、开源的多媒体知识提取系统。它将来自各种来源和语言的大量非结构化、异构的多媒体数据流作为输入,并根据丰富的、细粒度的本体去创建一个连贯的、结构化的知识库、索引实体、关系和事件。这个系统叫做GAIA,实现了对复杂图形查询的无缝搜索,并能够检索多媒体证据,包括文本,图像和视频。在最近的NIST TAC SM-KBP2019评估中,GAIA获得了最佳表现。
Manling Li 曾获得北京科技大学计算机科学硕士学位,在中国科学院大学取得了硕士学位。之后继续在美国伦斯勒理工学院深造,目前在伊利诺伊大学分校攻读博士学位。
论文:Don’t Stop Pretraining: Adapt Language Models to Domains and Tasks.
论文:Tangled up in BLEU: Reevaluating the Evaluation of Automatic Machine Translation Evaluation Metrics.
论文:How Can We Accelerate Progress Towards Human-like Linguistic Generalization?
论文:Torch-Struct: Deep Structured Prediction Library.
论文:Prta: A System to Support the Analysis of Propaganda Techniques in the News.
其中根据Aminer统计,来自微软亚洲研究院的周明位列华人榜首,共有12篇论文入选。发表过361篇论文的他,如今论文引用数已达到了13176。
第二名是来自西湖大学的张岳,此次共入围10篇论文。
第四名是来自于加州大学洛杉矶分校的Kaiwen Chang,共入围8篇论文。
并列第五的是来自于微软研究院的段楠,同样入围7篇论文。
在一作华人学生榜单中,来自加利福尼亚大学洛杉矶分校的赵洁玉入选4篇论文位列第一。
参考链接:
https://acl2020.org/
https://www.aminer.cn/conf/acl2020/