AI科技评论按:ICML 是 International Conference on Machine Learning 的缩写,即国际机器学习大会。如今,ICML 已发展为由国际机器学习学会(IMLS)主办的年度机器学习国际顶级会议。
与其他机器学习会议一样,近年来 ICML 的投稿数量持续暴涨。ICML 2017 的数字是 1676 篇投稿、434 篇接受论文,2018 年则是 2473 / 621,投稿数增加了 45%。对所有论文统计关键词做成词云,毫不意外地看到 learning、Deep、Network、Model、reinforcement learning、optimization 等词汇。
ICML 2019 大会将于 6 月 10 日至 15 日在加州长滩举行,比去年早了一个月。鉴于往年投稿数量多、审稿人水平参差不齐的情况,为了鼓励论文内容的可重现性和论文的高质量提交,ICML 2019 的程序主席之一 Ruslan Salakhutdinov 教授在 twitter 表示,今年将会对论文提交增加三个新要求:
2019 年 1 月 18 日是摘要的提交截止日期。只有提交了合格的摘要才能被允许提交完整的论文,用来占位的摘要将被删除。全文提交截止日期为 2019 年 1 月 23 日。
今年,修改论文上作者名单的最后期限是 1 月 23 号。在此日期后,将不接受任何更改。
最后,为了促进可再现性,极力鼓励在论文中附上代码。论文提交表单将有两个可选的补充文件:常规补充手稿和代码。在决策过程中将考虑结果的可再现性和代码的易访问性。在评审的过程中,结果的可再现性和代码的可获得性将会被考虑在内。
还有一个多月就要到投稿截止时间啦,那么如何投稿才能提高命中率呢?之前 ACL 组委会的审稿人给出了一些对投稿的建议,以及写论文的小技巧,或许可以作为参考:
Claire Cardie(Cornell University)
我对提交论文前一周的建议是:在这个时间点,一定要提前写好论文,用这一周的时间尽可能多的得到资深审稿人的意见,针对意见对论文进行修改。事实上,没有人能够提前很久就将论文写的完美无缺。从实际角度来看,我认为在论文提交的 deadline 之前有两点工作是最重要的。
(1)论文的 Introduction 部分一定要说服读者,让读者觉得你做了一个非常重要的工作,解决了一个重要问题,并且得到了很好的很吸引人的结果,同时也要解释清楚这项工作做出了哪些新颖的贡献;需要让读者能够清晰的知道这篇文章所讲述的「故事」。文章的其余部分则要按照简介所说的,进行详细的解释,但是如果简介写得不好,你的文章就已经失去了很多读者的阅读兴趣了。所以一定要保证文章的简介是无懈可击的。
(2)自己查找或者找人帮忙查找工作中或目前文章中的最可能使得读者「Kill」掉这篇文章的点。尽可能去修改这些问题。在 deadline 之前尽可能重复的进行发现问题-修改问题这个过程。文章中总有一些东西需要去改进。
Chris Dyer(Google DeepMind/Carnegie Mellon University)
当你想要完成论文的时候,你的最重要的考虑应该是这篇文章是否足够清晰和容易理解。每年都有众多的论文拥有吸引人的重要结果,但是因为它们很难理解,而导致被拒绝或者没有得到应有的影响力。审稿人错过了新颖点,而普通读者在挫败中放弃了阅读。尽管文章语言流利用词优雅很难能可贵,但这些都只是细节,不影响整体,这对于 non-native 的研究者来说是个好消息。而文章的清晰性是最重要的,这取决于你的文章的内在连贯性,以及论据的展开是否有逻辑。在这方面很有帮助的一个方法是,从不同的粒度来阅读和编辑论文,也可以称之为「从粗到细的阅读」。首先,只阅读摘要和介绍。你能从中了解到该文章的论点是什么,以及关键结果是什么吗?接下来,再一次阅读摘要和每个部分的第一句话。你在这些地方都使用了同样的论点吗?最后,阅读每个自然段的第一句话。从中你应该很清晰地了解到你所要讲的「故事」的框架。 如果在你「粗略」地阅读了这篇文章之后,你仍然能够理解它的论点,那么你就得到了一篇组织良好的文章,你的审稿人也会理解这篇文章的。如果不能的话,再优美的语言也不能够解决文章的问题。
Hal Daume III (University of Maryland)
我首先给出的建议就是:尽量留出充足的时间来写论文,这样就不会把所有工作拖到最后一分钟才做完。导师和学生之间应该有时间多次修改论文,也应该有时间从那些不熟悉你的方法的人那获得建议。如果你的导师相当熟悉你的工作,在研究过程中一直在听取你的汇报,那让一个从来没有听说过你工作的一个人来提供建议将非常有帮助(不过最好是相同研究领域的人)。确保留下了足够的时间,这样当你获得反馈意见的时候,你可以认真对待。我能想到的其他建议还有:自我反思,我是否积极地完成这项工作?我是否准确的引用了其他人的相似研究?(注意:准确是十分重要的。作为一个审稿人,如果作者没有认真地阅读他所引用的其他文章,会给我带来很负面的影响。)我是否在前几段明确了我做的贡献?如果你使用的是非母语的语言进行写作,一定要找一位 native speaker 阅读语法和选词。使用拼写检查器确保没有拼写错误。在内容方面,进行错误分析或者对结果讨论的章节是十分有用的。这样会使得论文变的更有吸引力,而不是仅仅列出了冷冰冰的数字。
Ray Mooney (University of Texas, Austin)
我给予学生的唯一一个建议是,看一看项目委员会,根据你的主题确定谁可能会审你的稿,确保你的文章引用了他所写过的相关论文,这样就能够避免由于你没有引用审稿人的相关论文而导致的负面影响。尽管这个建议有点讽刺,但是还是很有用的。
Philip Resnik(University of Maryland)
确保你没有落入「知识诅咒(curse of knowledge)」的陷阱中,也就是不能假设你的读者已经拥有了你的知识背景和隐含假设。这意味着,你首先应该让读者清楚的知道为什么他们应该关心这项工作。仅仅提高某些任务 X% 的性能是不够的;要清楚这个任务有什么意义是最重要的。这意味着你应该将你的论文集中在逻辑性上,而不是技术细节:论文的叙述应该按照逻辑组织,而不是时间顺序;关于模型和算法的重点应该放在文本正文中,同时应该用最平实的语言进行解释,而不需要详细的解析方程或者算法图;衍生或这实现细节应该写在文档中,如果对于会议读者非常有必要的话,将它们放在附录中。
在实验方面,要明确地分离训练数据和测试数据,并解释为什么选择了这个参数。比如你为 LDA 使用了 50 个主题,为什么不使用 20 或者 100?如果这个问题的答案不是「我事先选择的这个参数」,或者「我根据保留的数据调整出来的」,而是“我只是使用了测试结果中最好的那个参数”,那你就进行了一个无用的实验。你可以通过列举你所有尝试的其他值来弥补,但是你需要准备好接下来审稿人的问题:为什么要相信你选择的值会在下一个未知的数据集中取得最好的结果。如果其他的参数都导致失败的实验,那你应该参考以前的文献,并使用其中的参数,称之为「先前工作中典型的参数」,并引用那篇文章。
最后,英文写作的质量很重要。并不需要花哨或者诗意的文字,但需要条理清晰,语法正确,拼写正确,逻辑清晰。否则你的审稿人难以理解你的观点。如果你不是 native speaker,那么最好找一个 native speaker 阅读并修改你的论文。
点击阅读原文,查看 2019 AI 国际顶级学术会议一览表