点击上方,选择星标或置顶,每天给你送干货!
阅读大概需要16分钟
跟随小博主,每天进步一丢丢
2020年自然语言处理经验方法会议(EMNLP 2020)邀请研究者们提交与自然语言处理经验方法相关的、坚实的、原创的且未发布的长论文和短论文。目前大量的学者和同学都进入了最后冲刺阶段。在此,EMNLP组委会发出最后论文征集,同时也针对近期的一些问题提供集中解答,供大家在投稿前做最后检查。
• 匿名期开始日期:2020年5月1日
• 提交截止日期(长论文和短论文):2020年6月1日
• 作者回应期:2020年8月7日——13日
• 论文接收通知日期(长论文和短论文):2020年9月14日
• 论文印刷成型稿截止日期(长论文和短论文):2020年10月5日
• 主要会议期:2020年11月16日——18日
• 研讨会和指导会日期:2020年11月19日——20日
所有截止日的截止时间为 11:59pm UTC-12h(不论提交于何处)
EMNLP 2020 欢迎包括但不限于下列领域的相关主题:
提交的长论文必须是具有实质性的、原创的、已完成且未发表的工作。在适当情况下,应包括具体的评估和分析。长论文最多可包含8页的内容,外加不限页数的参考资料;长论文的最终版本将增加一页内容(即最多9页),以便作者考虑加入审稿人的意见。长论文将由项目委员会决定以口头或海报形式呈现。
提交的短论文必须是原创且未发表的工作。请注意,一篇短论文不同于一篇短的长论文。相反,短论文应该具有几页篇幅的重点内容。一些类型的短论文包括:一个小的、有重点的贡献;一些负面结果;一篇观点文章;一个有趣的应用程序。短论文最多可包含4页内容,外加不限页数的参考文献。一经接受,短论文可拓展为5页篇幅,以便作者将审稿人的最终版评论反映在此附加页上。短论文将由项目委员会决定以口头或海报形式呈现。
投稿作者名单应包括对所展示工作做出重大贡献的所有个人。提交给EMNLP 2020的每个作者都将收到提交、修改和最终决定的通知。在论文提交截止日期之后,提交EMNLP 2020的论文将不得更改作者的顺序和组成。
所有与您的投稿相关的参考出版物须在文献引用中体现,对于您所不知道的、与您的投稿相关的未发表的作品(特别是最近发表的和/或未被广泛引用的作品),可以不包括在其中。如果预印本已有参考出版物,应引用参考出版物而不是预印本。
在提交截止日期前3个月内出现的论文(无论是否被引用)都被视为与您的论文是同时期的工作,因此您无需进行进一步的详细比较。
EMNLP 2020不考虑已在任何其他期刊或会议上提交审核的论文,并且提交的论文在EMNLP 2020审核期间不得另投他处。本政策适用于所有相关会议和研讨会(如COLING、NeurIPS、ACL workshop)。例如,一篇正在ACL workshop审核的论文不能同时提交到EMNLP 2020。唯一的例外是,一篇论文可以同时提交给EMNLP 2020和EMNLP workshop。此外,我们不考虑任何与其他地方将要发表(或已经发表)的论文在内容或结果上有明显重叠的论文。提交一篇以上论文到EMNLP 2020的作者必须确保提交的论文在内容或结果上重叠率不超过25%。
作者必须遵守ACL道德规范中规定的道德准则。一直以来,对研究的道德影响、数据的使用以及工作的潜在应用的考虑一直是重要的,而且随着人工智能越来越流行,这些问题也越来越重要。我们要求所有作者阅读代码,并确保他们的工作符合此代码的内容。当一篇论文可能引发道德问题时,我们要求您在论文中对这些问题进行明确的讨论,这些讨论将作为审核过程中的考虑因素。如果作者被判定违反了道德准则,或者在工作中未充分解决存在的道德问题,我们将保留基于此原因拒绝论文的权利。
论文请以电子形式在Softconf START会议管理系统进行提交。长篇和短篇论文都必须使用官方提供的样式表,并遵循EMNLP 2020要求的两栏格式。请不要修改这些样式文件,也不要使用其他会议的模板。包括纸张大小、页边距宽度和字体大小限制在内的不符合要求的提交样式,都将被拒收。此点非常重要。
每个EMNLP 2020提交都可以附带一个PDF附录、一个用于前期的审核和作者回复的PDF文件、一个包含软件的.tgz或.zip存档,以及一个包含数据的tgz或.zip存档。EMNLP 2020鼓励作者提交这些补充材料,以提高结果的可复现性。作者也能够由此提供论文中所无法包含的额外信息。例如,匿名相关工作(见上文)、预处理决策、模型参数、特征模板、冗长的证明或推导、伪代码、样本系统的输入/输出、以及为准确复现论文工作所需的其他细节,都可以放到附录中。然而,论文提交需要与之完全独立开来,因为这些补充材料的提交是完全可选的,不需要审稿人的审核。如果伪代码、派生工具或模型规范是论文贡献的重要组成部分,或者它们对于审稿人评估论文工作的技术正确性而言很重要,那么它们被放到论文的主要内容中,而不是出现在附录中。补充材料必须完全匿名以确保双盲审核政策。
以下规则和指南旨在保护双盲审核的完整性,并确保审核提交内容的公平性。这些规则与匿名期限相关,该期限是从提交截止日期(2020年5月1日开始)之前的1个月到您的论文被接受或拒绝的日期(2020年9月14日)之间。在此期间撤回的论文将不再受这些规则的约束。
• 在匿名期间,您不得在线(例如,通过预印本服务器)向普通社区提供非匿名版本的论文。不同版本的论文涵盖的科学内容基本相同,但细节(包括标题和结构)和(或)长度可能不同。
• 如果您在匿名期开始之前在线发布了论文的非匿名版本,那么可以向会议提交匿名版本。提交的版本不得引用非匿名版本,并且您必须向会议告知非匿名版本的存在。
• 您不得在匿名期间更新非匿名版本,并且我们要求您不要在社交媒体上进行广告宣传或采取其他任何行动,这样会损害匿名期间的双盲审核机制。
• 即使在匿名期间,您也可以(例如,在OpenReview上)提供论文的匿名版本。
• 请注意,尽管在匿名期限开始之前在线提供非匿名版本是可以的,但这种行为不利于维护双盲审核机制,因此我们建议您等到匿名期结束再提供。或者,您可以考虑将您的工作提交给Computational Linguistics期刊,这个期刊不需要匿名,并且可以跟踪“短”(即会议长度)论文。
2020年4月29日更新:与Covid-19相关的论文可看作EMNLP的匿名期限政策的一个例外情况。如果作者认为他们的研究成果急需在EMNLP匿名期间(即从5月1日开始到2020年9月14日书面通知为止)分享在Covid-19全球研究社区上,在此期间我们允许作者将论文放在Arxiv上或以其他形式分享。但是,作者需要向EMNLP计划主席发送电子邮件(emnlp2020programmechairs@gmail.com)来获得提前批准,这样其论文将不受到会议匿名政策的限制。同时这些论文的审稿人也将知道这些论文没有违反政策。
由于审阅将是双盲的,因此论文中不得包含作者的姓名和所属单位。此外,能显示作者身份的自引用或链接(例如github)也不能出现,例如,“我们以前表明(Smith,1991)……”。相反,引用样式应该类似于“史密斯以前表明(Smith,1991)……”。不符合这项要求的论文将被拒绝。
论文不应该参考审稿人无法获取的文件来展示其中细节。因此,不要为了保持匿名性而省略或修改重要的引用信息,而应该使用第三人称或姓名来引用此作品(例如,用“史密斯表明”来代替“我们表明”)。如果审稿人无法获得这些重要的参考文献(例如,文献处于等待发表状态),那么应该将这些论文匿名并放在附录中,然后从提交的文件中引用它们,这样不会影响匿名性。论文可能附带的论文中描述的资源(软件和/或数据)也应该匿名。
论文作者在提交被其他会议/期刊所拒绝的论文时,可以一起提交该论文的先前版本、审稿意见和作者回复。这个操作是可选的。这样的政策是为了模仿TACL之类的期刊的修订与重新提交程序,EMNLP的这项试验是预告将来的EMNLP和ACL会议使用的审核流程可能发生的潜在变化。我们希望论文被拒的情况不一定要产生负面影响,反而可能对那些已解决过往审稿意见所发现的问题并可以为论文的改善提升提出有力的论据的作者产生有利影响。审稿人将不会看到过往的审稿意见,但领域主席和程序委员会主席会在控制审稿质量、解决审稿人之间的分歧以及决定处于录用边缘的文件时使用,并且在做出最终EMNLP录用决定时会考虑这个因素。
为了提高可复现性,在提交过程中,将要求作者回答以下可复现性清单中的所有问题。作者并不一定要符合清单上的所有标准,但要选择提交的论文所满足的标准。审稿人将通过这些答案来评估论文的可复现性。同时,审稿人也被明确要求在审稿意见中评价论文工作的可复现性。
以下清单是我们将初步使用的清单。
对于所有报告的实验结果,提供:
• 数学内容、算法和(或)模型的清晰描述
• 可下载源代码的链接,指明所有依赖项(包括外部库)
• 用到的计算设备的描述
• 每种方法的平均运行时间
• 每个模型中的参数规模
• 与测试集对应的开发集效果
• 所用评估指标的说明,以及代码链接
对于所有使用超参数搜索的实验,提供:
• 超参数的搜索范围
• 用于最佳性能模型的超参数配置
• 超参数搜索的次数
• 选择超参数值的方法(例如,均匀采样,手动调整等),以及选择的标准(例如,准确率)
• 预期的开发集效果(可参考Dodge等人在2019年的工作的第3.1节的介绍),或者使用另一种度量方法,即将均值和方差作为超参数试验次数函数。
对于所有使用的数据集,提供:
• 数据集相关的统计信息,例如样本数量
• 划分训练集、验证集、测试集的详细信息
• 对所有排除的数据的相关解释以及所有的预处理步骤
• 可下载版本数据的链接
• 对于新收集的数据集,数据收集过程的完整描述,例如对于标注者的规范指导以及控制标注质量的方法。
感谢Jesse Dodge帮助完成上述清单。它基于Dodge等人的工作(2019年)和Joelle Pineau的复现性清单。
所有被接受的论文都必须在会议上提交才能在正式会议记录中出现。如要撤回论文,在EMNLP 2020上进行展示的论文的作者必须在印刷成型的截止日期之前通知项目主持人。对于工作的前期介绍(例如arXiv.org上的预印本)应在EMNLP 2020会议论文集的最终版本中用脚注注明。请注意,此脚注不应出现在论文的提交版本中。每篇被接受论文至少需要一名作者在注册截止日期之前注册EMNLP 2020。
A1:EMNLP欢迎为所综述的文献做出了有意义的贡献(例如得出了新结论,提出当前研究的空缺及未来潜在的研究方向等)的论文。
A2:EMNLP欢迎那些内容曾出现在具有ISBN/ISSN/DOI或类似编号的会议中,但没有被正式收录进会议记录的论文。
A3:arXiv上的提交截止时间为5月1日 11:59pm UTC-12h(不论提交于何处)。而其他非匿名版本的截止时间是该版本的公开时间。
A4:鉴于我们最近受Covid-19的影响变更了论文提交日期和通知日期,我们破例允许同时向EMNLP和其研讨会提交论文。这个变化也反映在了CFP(call for papers)上。
A5:我们的匿名政策不允许作者在5月1日至9月14日期间在网上发布研讨会论文。
A6:只要你不在匿名期间更新你的arXiv预印本,你就不会违反匿名政策。也就是说,你仍旧可以在匿名期开始后更新相关的web演示和Github内容。
A7:请参照提交表上的附录模块提交附录。审稿人是可以看到附录的,它会出现在一条指向论文本身的单独链接里。审稿人一般不会看这一部分,除非你在论文里引用到它。
A8:比起链接形式,以zip压缩格式上传你的数据集或许是个更好的选择,因为这样能够让数据在审稿人和相关主席间保持私密性,不会在更大范围传播。我们的政策禁止审稿人在审阅过程中窃取数据或剽窃想法。如果你还是担心这个问题,那么只需要上传数据集的一个小样本,让审稿人有所了解即可。
添加个人微信,备注: 昵称-学校(公司)-方向 , 即可获得 1. 快速学习深度学习五件套资料 2. 进入高手如云DL&NLP交流群 记得备注呦