2019年,我投稿了一篇论文,审稿分数为 2.5、3、3,被拒。一周后,我仅做了些微修改再次提交,这次却以 4、4.5、4.5 的分数被接收。要知道,从“中等偏下的拒稿”跃升至“强烈接收”,这是个几乎难以想象的分数跳跃。

https://maxwellforbes.com/posts/how-to-get-a-paper-accepted/

这篇文章将详细展示我所做的具体改动,分为两个部分: 1. 优化第一页以获得接收机会 1. 利用后续页面避免被拒

第一页包括四个组成部分:标题、摘要、图1和引言。我们的目标是让它们具体、有记忆点、清晰、传达价值并吸引读者。评审通常会在第一页就决定接收或拒稿,所以我们需要最大化“翻页前的判断”。 然后,在正文部分,我们通过加入基准对比、消融实验、统计显著性和人工评估等内容,来尽可能规避被拒的风险。 令人惊喜的是,这些为了接收而做的小改动,不仅提升了论文的表达,也增强了其科学贡献。如果你正在考虑走捷径,请阅读文末脚注。完整的被拒与被接收版本也可在文末下载。目录 第一页占据了论文质量的 80%

选择一个具体且令人印象深刻的标题 * 或许可以加入品牌效应 * 展现出显而易见的价值 * 用总结性结论作为每个图注的结尾 * 摘要:一个具体而有价值的“钩子” * 在引言中运用张力/释放的节奏

用论文剩余部分避免所有拒稿理由

让图表既信息密集又美观 * 大胆构造一个有用的分类体系 * 适当增加图表以丰富形式 * 让你的贡献熠熠生辉 * 删除论文中约 2/3 处的冗余内容 * 补充所有你可能被问到的问题 * 稍微做到“过犹不及” * 三句话的结论

论文的科学价值也得到提升


一篇论文的 80% 决定于第一页

一篇论文有五个关键组成部分: 标题图1摘要引言正文其余部分 请对这五部分投入相等的精力。 ——“我”对 Jitendra Malik 引用 Don Geman 的误传

大约 80% 的“感知质量”在第一页就形成了。标题、图1、摘要,以及引言的前半部分都在那里。这就像是一本书的封面。 本文将展示那篇经历分数跳跃的论文的被拒与接收版本第一页的对比图:

左图为被拒第一页,右图为接收版本。


首先,想想第一页的第一印象:

图1是否色彩鲜明、引人注目? * 标题是否出人意料?是否包含一个引人注意的关键词? * 是否有一些令人好奇的术语(加粗或斜体)? * 引言是否(希望不要)充满引用?


**选择一个具体且令人印象深刻的标题

被拒版本:Visually Grounded Comparative Language Generation —— 太笼统。任何利用图像生成比较描述的工作,都可以用这个标题。我当时选择这个标题,是因为觉得它强调了方法的通用性;但过于宽泛的标题往往会令人反感,因为它显得过于夸大。此外,我们方法的重要部分确实依赖于特定领域——我们是利用生物分类法来构建数据集。 被接版本:Neural Naturalist: Generating Fine-grained Image Comparisons —— 具体且易于记忆。除了具备品牌效应(后面会详细说明)外,“naturalist”明确了研究领域,而“fine-grained”则限定了任务范围。对那些持怀疑态度的学者来说,清晰说明所做工作十分讨喜,这个标题完全属于我们的工作。


**或许可以加入品牌效应

我曾不喜欢在论文中使用品牌命名,觉得为自己的论文冠以专有名词太过自负,并希望读者能记住它,而且许多名称听起来过于俗气。 如今,虽然我偶尔仍会觉得有些不适,但渐渐认识到,为概念命名确实更容易让它们被记住和讨论——比如说“Neural Naturalist”或“Birds-to-Words”,比起那种“我们2019年那篇关于生成比较性图像说明的EMNLP论文”要简洁多了。 当然,我仍然讨厌那些没有内在联系或让人觉得没有来由的随意命名。我并不认为每篇论文都需要品牌名称,但我觉得对于这篇论文来说,这确实帮了大忙。


**展现出那种“显而易见”的价值

关键在于,你的论文价值应该一目了然,而不在于其内容必须极其浩大。


(下图对比:左侧为被拒版图 1,右侧为接收版图 1。) 图 1 应当满足以下几点: * 能够吸引读者 * 清楚展示论文做了什么,同时传达其价值 * 即便不看图注,也能让人理解图示内容

旧版图 1 显示了两个独立的比较,但两者之间的联系不够明确;对于非专业人士来说,下排的图像看起来都像猫头鹰;而且说明文字又过长又乏味。 新版图 1 则通过在左侧使用相同图像作为锚点,并为每个比较标注了“感知难度”(如“高”与“中”)来明确表达重点;它标注了操作(“vs”即“比较”)以及结果(“细节丰富”与“细节较少”);此时,论文的基本机制和独特性就已经呈现出来:我们使用不同的语言,根据外观相似度来进行比较。最后,为了让那些较长的描述更易接受和有趣,我们用橙色下划线和绿色气泡高亮了两个关键组成部分(特征与部件)。


**图注以结论收尾

我认为这是我学到的最好的写作技巧之一。

新版图 1 的图注密度极高,几乎整个图注都是总结性结论(以黄色标出);对比之下,旧版图 1 的图注中有侧注(以红色标示)占据了近三分之一的宝贵“首页”空间! 图注中的总结性信息不在于字面描述图中所展示的内容(这部分先展示),而在于直接告诉读者“你应该从中得出什么结论”。 在科学写作中这么做可能会让人觉得奇怪,因为它似乎跨越了纯粹描述与解释的界限;但我强烈建议你这么做,尤其是在计算机科学等较为非正式的领域中,因为: * 你通过直接写出来,节省了读者试图理解你想表达什么的时间07 * 有了好的图注,读者甚至只看图和图注就能大致了解整篇论文

毕竟,科学阅读者对你所写的每一句话总是持保留态度,所以不要为“解释”那部分过分担心。 如果你不试图证明某个观点,也许应该重新考虑该图是否有存在的必要。


**摘要:一个具体且有吸引力的钩子

某些类型的学者(比如我)常犯的错误,是从大而泛的概念写到具体话题,因为这似乎显得有条理、符合分类体系。

(下图对比:左侧为被拒版摘要,右侧为接收版摘要。) 结果证明,正如被拒版摘要所展示的那样,这种写法不仅无聊,而且给人一种夸大其辞的感觉。在采用自上而下的框架后,插入了一个旁白,随后当揭示真实任务时又显得范围过窄09。 在修改后的摘要中,一切都更加具体:明确了我们研究的对象、我们的贡献(数据集与模型),甚至对具体鸟种以及在人类评估中所完成的任务都做了文字描述;同时还有结果预告和某种独特钩子的暗示。修改后的摘要不仅更具体,还更有趣、更引人入胜。


**引言中运用张力/释放节奏

你能相信我们还在讨论第一页吗?因为它实在太重要。 这里讨论的是第一页可见范围内的引言部分,我们的目标是优化“翻页前”的评判效果。 我原来的草稿写得非常糟糕,以至于修改时很容易看到改进点。但如果我作为一名博士四年级学生能写出那样糟糕的文章,其他人完全也可以。

(上图为被拒版首页引言,下图为接收版首页引言。) 原版引言完全没有提及问题,也缺乏张力;一开始就堆砌了大量相关工作,甚至在一旁暗示我们自己的论文存在负面问题。 而修改后的引言则直接切入问题所在,采用了多层次的张力/释放结构来提高问题的“看点”和解决方案的吸引力: * 在段落层面上,第一、第二段营造出问题的紧迫性(张力),第三段则提出我们的解决方案(释放); * 在句子层面上,通过使用“但是”、“困难”、“压力”等词汇制造紧张感(例如:”而当X、Y同时出现时……不幸的是……“)。

在这种张力/释放循环的骨架上,我们用头两段来凸显任务的具体性、难度、价值以及独特性,这四个形容词可不是随便挂出来的。 而第一页最后可见的那部分文字则引入了我们一个具体的贡献——我们的数据集。 我本来不太愿意推荐视频资料,因为视频通常较抽象且长达八十分钟,但Larry McEnerney关于“有效写作”的讲座是我见过最好的写作思考资料。虽然我是在研究生毕业后才看到它,回想起来我真希望在研究生期间就能看到,因为我花了很多时间试图逆向工程其中的种种技巧(在本文中也有所展示)。一些相关的关键点如下: * 在你工作之前,生活中的所有教师都是付费阅读你的作品; * 而既然他们现在不再付费,你的写作就必须直接传递价值(这往往包括娱乐性); * 高价值的文本会用充满张力的语言提出问题,说明所涉及的成本或收益。

写修改稿时,我并没有当时意识到这种问题、张力、价值的框架,但事后回看,我惊讶于改进后的草稿是多么忠实地遵循了这一框架。


**利用正文避免一切拒稿理由

如果我们完成了这部分工作,评审人在看到第一页后已经倾向于接收我们的论文。接下来,我们的任务就是让他们最终接收。那么,如何做到这一点呢? 其实,我这里有一个很棒的两步法,完全采用逆向思维来操作: 1. 想想评审会因为什么理由拒稿; 1. 针对这些理由,全部避免出现。

最明显的拒稿理由通常与“完整性”有关:例如“你没有与方法 X 进行对比”。而这些理由往往是评审用来为他们基于不清晰判断的直觉决策找借口的客观依据。所以,我们必须既保证论文内容的完整性,又要提升表达的清晰度。 在第一页之后,我主要做出的改动包括: * 提升所有图表与表格的清晰度

增加基线对比

加入消融实验

重写结论(以提升清晰度)

此外,其他常见的补充内容还包括: * 人工评估(增强完整性) * 统计显著性(增强完整性)

正文的主体文字基本保持不变,这其实是个好现象,因为即使有人仅通过浏览图表、表格和结论,也能感受到论文改进后的全面提升。


**让图表既密集又美观

论文中有个复杂的部分叫做“pivot-branch sampling”。我对这一部分非常兴奋,但其他人似乎并不感兴趣(我觉得甚至连我的合作者都不怎么喜欢,尽管他们出于礼貌从未直接说出来)。 我本来将大部分关于 pivot-branch sampling 的内容放到了附录中,但在正文中还是需要略微提及,因为这毕竟是篇数据集论文。 不过,之前的描述显然不够清晰。图 2 原本是用来解释这一内容的,但效果不佳;在修改稿中,我添加了一些辅助图示,大大提高了概念传达的效率。

(对比:左侧为被拒版图 2,右侧为接收版图 2。) 在被拒版中,我曾认为浅灰色的文字会更好,因为设计准则中建议不要使用纯黑色,但这种颜色与正文中的纯黑字体形成了奇怪的对比; 而在接收版中,我选择了无衬线黑体,这使得图像显得更坚实、独立。而更重要的是,我利用图表空间直观地解释了 pivot-branch sampling 的原理。


**尝试构造一个有益的分类体系

最初评审对我们的数据集感到疑惑:它究竟是否有趣或有价值? 我曾因糟糕的措辞而陷入困境,把我们的贡献描述成微不足道的增量改进(参见上面的摘要和引言部分),不过过度纠正又没有什么坏处,对吧? 在修订稿中,我首次加入了一个表格,对比了最相关数据集中的示例句。单单这一表格就非常有力,因为例子往往能直观传达关键信息。 更让我茅塞顿开的一点是,我可以简单地构造出一些有用的比较维度(如图中圈出的部分),以此来对数据集进行定性甚至定量的框架划分。

该数据集对比表正是新版中新增的部分,不仅例子本身极具冲击力,而且我所构造的分类体系也有助于对比和量化数据集的特点。


**适当增加图表以增加变化

图表可以打破论文单一的视觉节奏,还能展示一些纯文字难以传达的属性(例如:我们数据集的文本比其他数据集更长)。

别忘了,我们在图注的结尾依然放置了总结性信息。


**让你的贡献熠熠生辉

我之前在模型图中未能很好地突出模型的有趣之处;在修订版中,我不仅将我们进行消融实验的组件(以黄色和红色标出)单独拉出,还用颜色将它们与后文结果表链接起来。作为额外加分项,我们还采用暖色调(黄色、红色)表示编码器,而用冷色调(蓝色、绿色)表示解码器。

我通过在图注中提前指出哪种模型配置效果最佳,来帮助读者更好地理解。记住一个好技巧:不要刻意藏匿信息以“惊喜”读者,他们喜欢提前知道主要内容。


**删除论文中大约 2/3 处的冗余内容

上述许多改动都占用了更多篇幅。那么该如何删减呢?

对于一篇八页的论文来说,第五至第七页往往包含了可以精简的部分。 幸运的是,我们原先的一个图展示了太多的输出样本,我本人非常喜欢展示系统的输出,因此原稿中列出了九种情况(即18组图片和段落)。虽说这很不错,但缩减到六种情况已经足够,而且还能让我们更仔细地挑选展示的内容11。 注意,这里没有额外的总结句;规范都是指南,如果觉得总结信息冗余且不适,就可以省略。


**补充所有可能被提及的评审问题

这正是逆向思维发挥作用的地方:想想评审最常见的抱怨,然后全部避免。 评审最容易用来拒稿的理由包括: * 缺少基线对比 * 缺少消融实验 * 缺少人工评估

因此,我们都一一补充进去了。 我最喜欢的是在图注中(以黄色标示)强调并解释了一个表面上看起来较弱的结果(以蓝色标出)。

基线与消融实验其实并不难复现,而且很可能还提升了论文本身的科学贡献(稍后会详述)。 关于人工评估,我们原本已经有了一个很好的设计——让人们基于客观任务(例如:能否正确区分动物)而非主观打分(如流畅度1到5评分)来评价输出。这部分内容没有做改动。


**稍微做到“过犹不及”

我们甚至为修改版论文腾出位置,放入了一张非常大的消融实验结果表。进行大量消融实验12在数据集较小时确实是一种奢侈13。

(新版中附有消融实验的表格。) 当然,你不必在每次消融上都过度努力,只是在合适的地方添加一些数据即可。在后续论文中,我甚至把更多细节放进了附录。大量而恰当地补充信息会显示你对工作认真负责、付出了大量努力。


**三句话的结论

为了修改结论,我提炼了摘要与引言中的要点,同时删去了所有铺陈性的文字。剩下的便是一个具体的、三句话构成的亮点式总结。

(对比:左侧为被拒版结论,右侧为接收版结论。) 传统的写作建议通常会告诉你:“结论用三句话写”: 1. 我们做了什么? 1. 为什么这件事很棒? 1. 为什么这很重要?

虽然被拒版结论大致也遵循了这一结构,但修改后的版本在具体性上有了极大的提升。


**科学成果也因此得到了提升

在做出这些主要是审美上的修订之后,看到论文以如此高的分数被接收,最初的兴奋感终究会消退;我开始对科学变得有些愤世嫉俗。曾经我以为我们只不过是在改进论文的外在表达,论文核心的科学工作——数据集、模型、人工评估以及整个任务框架,仍是原来的样子(这无疑是最难做到的部分)。 如今我认为,表面上的这些修饰实际上强化了内在的科学贡献。让我来解释原因: 现代科学的核心产出就是研究论文,而论文本质上是一种传播行为。 很少有人会下载并真正使用我们的数据集;也没有人会下载我们的模型(因为那被封装在谷歌的专有系统内)——但任何一个阅读我们的论文的人,都能从中学到我们做了什么。通过对论述的清晰性和完整性的改进,读者每花一分钟阅读,能学到的东西就更多。而这不仅仅是速率问题,更存在一个“阈值”,只有超过这一阈值才能从中学到新东西。 科学就是传播,传播效果的提升就等同于科学的提升15。


附言:让读者想继续看下去,与游戏设计的异曲同工 让读者产生“想继续读下去”的欲望,与游戏设计中的吸引玩家不谋而合。你可能认为科学论文中无需使用这些技巧,但事实上,枯燥难懂的文字会吓跑读者,掩盖论文的主要信息,进而削弱贡献的影响力。让读者读完至少一页,乃至整篇论文,是必须优化的目标。就像游戏设计中需要“钩子”一样,游戏会运用多种方式(例如:情节制造张力、待办事项激励、数值攀升)来吸引玩家,缺少这些“黏性”,游戏很容易就会让玩家感到厌烦而半途而废。在论文与游戏中,我们都必须让作品足够吸引人,从而驱使使用者去体验我们全盘的创作内容。

**

成为VIP会员查看完整内容
17

相关内容

论文(Paper)是专知网站核心资料文档,包括全球顶级期刊、顶级会议论文,及全球顶尖高校博士硕士学位论文。重点关注中国计算机学会推荐的国际学术会议和期刊,CCF-A、B、C三类。通过人机协作方式,汇编、挖掘后呈现于专知网站。
CVPR 2023 接受论文列表发布 2360篇论文都在这了
专知会员服务
58+阅读 · 2023年4月9日
专知会员服务
38+阅读 · 2021年3月31日
专知会员服务
60+阅读 · 2021年3月17日
Transformer替代CNN?8篇论文概述最新进展!
专知会员服务
77+阅读 · 2021年1月19日
近期必读的六篇 ICLR 2021【推荐系统】相关投稿论文
专知会员服务
47+阅读 · 2020年10月13日
CIKM2020 | 最新9篇推荐系统相关论文
机器学习与推荐算法
12+阅读 · 2020年8月20日
22篇论文!增量学习/终生学习论文资源列表
专知
32+阅读 · 2018年12月27日
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
Arxiv
165+阅读 · 2023年4月20日
A Survey of Large Language Models
Arxiv
452+阅读 · 2023年3月31日
Arxiv
68+阅读 · 2022年9月7日
Arxiv
15+阅读 · 2021年6月27日
VIP会员
相关基金
国家自然科学基金
15+阅读 · 2016年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
7+阅读 · 2015年12月31日
国家自然科学基金
8+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
5+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
3+阅读 · 2014年12月31日
微信扫码咨询专知VIP会员