又在引用谷歌学术第一页的论文？让我们来谈谈「文献引用」这件小事

2019 年 10 月 3 日 机器之心

机器之心整理

参与：魔王、泽南

或许对于很多年轻研究者来说，现在引用其他文献最省事的方法就是在搜索引擎里寻找排名靠前的相关论文，简单阅读然后使用。然而事实上，这种马太效应正在让学术创新的速度下降。

近日，华盛顿大学助理教授 Jevin West 对于学术论文引用的研究引发了人们的关注。在学术研究会议 MetaScience 2019 上，他表示：今天的学术论文在文献引用方面呈现越来越集中的趋势——一个热门领域，被反复引用的总是那几篇相同的论文。

近几年来，Top 5% 论文的被引用百分比越来越高了——这还是在论文数量呈爆炸增长趋势的情况下实现的。

对于人工智能这样正在快速发展的学科来说，由于研究数量的激增，情况尤为明显。这一现象引起了人们对于学术创新性的担忧。

加州大学伯克利分校（UC Berkeley）电子工程与计算机系教授马毅对此评论道：「目前在人工智能机器学习领域会议论文的 scholarship，几乎荡然无存。大家都认为前人什么都没有做过，也不再认真验证自己的工作到底有哪些原创。请记住：不尊重前人的工作，就不要奢求他人和后人尊重你的工作！」

对于研究人员来说，在开展自己的项目之前，我们应该充分了解领域内已经出现的研究。那么在科学写作中，什么才是负责任的文献引用？如何实现负责任的引用呢？

在对于论文引用集中化的讨论中，很多人提到了荷兰马斯特里赫特大学生物医学和社会学副教授、科学学（Science of Sciences）学者 Bart Penders 写过的一篇文章《Ten simple rules for responsible referencing》，其中列举了实现负责任的文献引用需要遵循的十条简单规则。它或许可以对你有所帮助：

研究人员能够阅读和写作包含高质量文字、严谨数据、论点和结论的文章，文章中还包含已有的文献内容，但同时研究人员会明确表明所著文章的新颖之处。研究者通过列出参考文献来展示研究的基础，以及该研究与之前工作的区别。这些区别包括：对之前的研究进行探究或反驳，对之前的论点或论断进行扩展，提出新想法、新建议，以及基于之前研究提出假设。这就带来了一个问题：如何确定引用哪些研究或作者，以及用什么方式引用。

在写初稿的时候，研究人员就要确定包含或排除哪些之前研究，及其引用方式。引用规范的文本会将作者论点置于恰当的知识背景下，从而支持其新颖性、价值和可见性。引用将多项研究串联起来，创建出一个有意义的知识网络，允许其他研究者据此判断该研究是一般相关，还是与他们尤其相关。

一方面，文献引用将相关的科学贡献放在一起（无论其贡献大小），从而创造价值。在此过程中，它们对不同研究的贡献进行评估，对已发布文章的相对地位进行梳理。另一方面，文献引用存在于目前的科学评价机制下。尽管在日常写作实践中不被过多注意，但在研究中引用文献的行为应该遵循基于价值的科学内部标准（如内容、相关度、贡献）和科学外部标准（如可信度、性能）。

由此可见，文献引用并非中性行为。引用是一种科学货币形式，积极地肯定或否定价值。引用特定的来源（尤其是经常引用）会合法化想法、固化理论、将论断建立为事实。参考文献还能带来透明度，其他研究者可以根据参考文献追溯你的研究脚步。因此文献引用是一个道德问题，它汇聚了科学的多种价值。

引用竞争对手的文章会增添对方的光彩，引用科学期刊的论文会增强期刊影响因子，引用导师或实验室同事的文章有助于构建你自己的学术形象，引用合适的论文有助于体现你对特定领域的熟悉度。所有这些都转换为科学家引用特定来源时的压力，这些压力来自同侪、编辑等。Fong 和 Wilhite 在 [1] 中介绍了强制性文献引用的盛行。

此外，近年来基于引用量的度量指标业已发展成为质量和影响力的代名词，但它目前遭到了大量批评。因此，规范地、负责任地引用文献是所有科学家都很关注的事情。

下文列举了负责任地引用文献的 10 条简单规则。科学家作为作者时要生成参考文献，作为读者和评审者时则需要评估参考文献。通过所有科学家都遵循的这一对称关系，他们有责任将文章中包含的所有知识汇集起来。然而，生成和评估参考文献是迥然不同的过程，需要不同的责任。遵循研究者和文献之间的双重关系，前六条规则主要涉及生成参考文献及其包含的责任。后四条规则涉及评估参考文献，以及这些文献成为论文一部分后所获得的意义。

规则 1：纳入相关的引用

所有学术写作都要求展示所提出问题的现实意义、使用方法、材料使用的基本理由，以及与文章内容相关的问题讨论。所有这些，或者至少绝大部分，是通过引用相关的之前研究来实现的。省略此类引用会使人误解：你的文章是某个想法、问题、方法或批判的源头，而这种「占为己有」的做法是违规的。文献引用确定想法的来源，查询引用文献可以帮助读者更加细致地研究它们，以及评估你对文献的使用是否恰当。

唯一的例外是，事实、研究结果或方法已经成为科学或学术准则的一部分。我们没必要对「DNA 含有四种碱基」提供参考文献，也不用在每次使用 PCR 时都引用 Kjell Kleppe 或 Kary Mullis。但是，确定某个事物何时真正成为准则的一部分是很难的，它需要长期的调整和协商。

规则 2：阅读被引用的文章

文献引用不是行政任务。首先，引用一篇论文的原因可以有多个，从报告数据到方法不一而足，而且可以正面引用也可以负面引用。确定文章内容是否支持自己论断的唯一方法就是通读全文。

其次，支持你的工作和论点的参考文献集合是该工作获得信用的要素之一。同样，批评、质疑、反驳你的工作的参考文献也是重要要素。因此，链条的强度取决于其最薄弱的一环。你信任和认为权威的文章质量共同决定了你的工作的质量和信用。

引用率，尤其是期刊引用率，无法充分反映研究的质量。它们混合了正面和负面的引用，从而无法区分文章是被认可还是被质疑。为了有意义地、有权威地引用，你需要查看文章内容，把内容作为是否引用的标准，而不是别人是否也引用了这篇文章。

规则 3：依据内容进行引用

在研究的某个阶段，如果你确定某项研究值得被引用，那么如何引用以及在何处引用就需要你谨慎考虑了。仅仅在文章中包含该研究是远远不够的。你需要介绍该来源文章的确切贡献，而不是泛泛而谈。这可能意味着你需要在整篇文章中多次提及某一个来源文章，包括解释。

打破规则 3 的一种方法是：特洛伊引用（Trojan citation）。当一篇文章的研究结果与你的类似，而你却仅在讨论小问题时引用了那篇文章，忽略了（有时候是故意忽略）其关键论点或贡献，这就是「特洛伊引用」。特洛伊引用关注一些微小的细节，从而模糊化被引用文章的真正意义。

因此，它隐藏了这个事实：其实你的研究并不像看起来那么新颖。

特洛伊引用是不可靠的，但它可以满足评审人员或者编辑对引用相关论文的要求。另外，特洛伊引用也可能在不知情的情况下出现：1）你不了解被引用文章的内容（不遵循规则 2 会很大程度上导致对规则 3 的破坏）；2）科学社区、作者贡献或者科学文章的质量存在争议（这种情况可参考规则 4）。

规则 4：透明地引用，而不是中立地引用

即使依据内容进行引用，引用仍需要语境。当被引用内容是文章论点的一部分时，这尤为重要。并非所有引文都是文章论点的一部分。引用数据、资源、材料和已有方法对语境的要求较低。但如果引文是论点的一部分，则仅仅包含引文（即使是在合适的位置）无法传达参考文献的价值，进而影响到引用它的基本理由。

Nature Genetics 编辑在近期的一篇社论中反对中立引用（neutral citation）。他们认为中立引用只是看起来中立或程序正义，但实际上缺乏对被引用来源语境或引用理由的展示。引用应该在研究结果是否支持报告数据或结论的背景下对价值、相关性或意义进行评估。

这源自于引用的政治性，即使该术语很少用于这一语境。研究者可以通过是否引用以及被引文章的贡献是否合格，来准确地表示、夸大或贬低贡献。语境或理由可以通过使用合适的动词来实现。

研究人员可以使用错误的限定词（如『the authors suggest』 vs 『the authors establish』、『this excellent study shows』 vs 『this pilot study shows』）来夸大或贬低特定参考文献的贡献。

如果是故意为之，则这是一种骗术，它改写了科学准则的内容。如果并非故意，则这是写作草率的结果。问问自己为什么引用之前的研究，哪些价值是它们创造的，以及你对这两个问题的答案是否可以被读者知道。

规则 5：需要时可以引用自己的研究

在批判性讨论引用和评估基于引用的指标时，自引用（self-citation）几乎是个禁忌。但是，我们需要意识到自引用具备很重要的功能，它能够展示个人研究的增量迭代式发展。因此，你可以遵循以上原则引用你自己或所在小组的之前研究。不同领域可接受的自引用数量不同，较小的领域更有可能接受更多的自引用量。

这并不意味着自引用不会有任何问题。例如，过度自引用可能是「切香肠」：这种论文发表策略将单个研究中的多个要素分别发表。这种不可靠的研究行为常常伴随着自引用，旨在夸大已发表文章和引用指标。

规则 6：给所有参考文献划分优先级

很多期刊对参考文献数量有限制。不同出版社、期刊和文章类型所要求的参考文献数量也不尽相同，比较少的有 3 篇（比如 Nature 的 Correspondence 文章）。即使对参考文献数量没有限制，一些期刊也会限制引文字数。遵循这些限制有时需要艰难地抉择，比如删除你认为符合规定甚至必要的引用。为了处理这个问题，避免随机删除引用，你需要对所有参考文献划分优先级。Box 1 中介绍的几条经验法则可以帮助到你。

Box 1：参考文献优先级

「划分参考文献优先级 10 条简单规则」可以帮助你为所有参考文献划分优先级。在大部分情况下，选取这 10 条规则中的几条就足够了。

每篇论文都需要对被引用文献划分优先级：优先级无法复制。
为每个章节划分优先级（如引言、方法、讨论），而不是整篇论文一概而论：不同的章节需要不同类型的支持。
引言部分，把综述论文放在优先级高的位置，为关联性和主旨提供广阔的语境。
讨论部分，将实证论文放在优先级高的位置，详细记录相对贡献。
已评审论文的优先级高于未评审或待评审论文（如社论、预印版论文等）。
自引用的优先级最次。
限制支持某个特定论断的参考文献数量，如果必要，限制在 1。
将方法引用移到附录（在线）信息。
关联度一致的情况下，优先引用一作或最后一作为女性的文章，帮助修复科学界的性别失衡。
已经使用以上九条规则后，如果还有参考文献优先级不明的情况，可以咨询编辑。

规则 7：根据参考文献被选择的理由进行评估

研究文章不止具备数据或研究结果。它们还记叙性地解释为什么这些问题值得提出、答案意味着什么、答案是如何获取的，以及为什么该文章值得信任等等。此外，这些研究文章还有一个目的：未来作为参考文献支持其他研究。研究文章的每个元素都由其他研究支持，每一个此类链接都是作者基于想要达到的目标积极选择的结果。

在这种记叙的另一端，读者频繁地评估这个故事，询问是否可以换一种方法讲述。意识到可以通过引用其他文献换一种方法讲故事并不能否定之前讲述方法的意义。两个故事、两种引用选择都是政治性的选择，为论点提供作者可以聚集的能量、信用和正当性。它们是为作者想要说服的人——同行，所量身定做的。选择是否引用某篇文章只能在那种记叙和引用角色的语境中来评估。Peritz 对引用角色（citation role）进行了分类，来支持这种评估。

规则 8：在修辞情境下评估引用

修辞手段旨在说服和劝说。记叙只是用来说服受众的工具之一。研究论文中，比喻、数字和联想等所有特征都是为了说服读者。科学文章经过了数个世界的发展，囊括了其中的很多手法，其目的是说服读者相信作者是正确的。

Bazerman 在《Shaping written knowledge: The genre and activity of the experimental article in science》一书中详细介绍了相关内容，并督促我们将学术文本及其功能作为社会和智力努力的一部分。

通过引用特定来源，作者展示了其对学派、社区或科学论战的忠诚，在这个层面上，引用是科学的社会层面的一部分。对引用的其他修辞性使用包括明确引用著名人物及其研究，以迎合权威，而长长的参考文献列表可以暗示你认真研究了主题。

考虑一下这个问题：作者可将某个领域描述为「得到充分研究」，并使用三个参考文献 X、Y、Z 来支持其论断。或者，他们可以认为该领域未经充分研究，但是存在三个例外：X、Y、Z。理解特定文本中 X、Y、Z 被赋予的价值需要对作者的修辞手段进行评估。

规则 9：按照框定交流（framed communication）来评估参考文献

作者使用词汇来完成任务，服务目标，定位自己的研究和其他研究。他们以非常特定的方式框定（frame）之前的研究，以支持自己的论点。我们都是这样。规则 8 中，将 X、Y、Z 作为常态或例外就是一种框定。

意识到这种框定，以及 X、Y、Z 因为框定而在文本中获得意义，这是非常重要的。正如 Goffman 所说，没有无框定的交流。所有信息和文本都包含也需要一个框架——定义和假设的结构，来帮助组织前后连贯性、连接以及意义，换句话说，即对现实的认识。

因此，引用并不是划在文章 A 和 B 之间的一道中立线。相反，被引文章 A 的表示仅在被文章 B 引用的语境中获得意义。文章 A 在被 B 或 C 引用时的框架是不同的。它在 B 中可以被定义为创新性的，而在 C 中可以被定义为教条的。框架通常不是撒谎或行骗，它是在语境中对论据的规范定位。因而，引用是对来源的相关元素的谨慎转换，仅在当前语境中有意义。

这带来了一个重要的后果：仅仅计算文章 A 中的参考文献数量无法说明 A 对科学社区的价值。这一点也是莱顿宣言（Leiden Manifesto）的第一条原则，即量化指标支持但无法取代定性评估（阅读论文时应多注意政治、修辞、语境和框架，即遵循规则 7-9）。莱顿宣言由文献计量学家和研究评估学者提出，它得名于 2014 年在荷兰莱顿举行的科学与技术指标研讨会。它提醒研究者不要滥用基于引用的研究指标。

规则 10：接受不同领域的引用文化

尽管上文批评了学术引用体系，但科学是以这种方式组织的，引用会继续作为现行「通用货币」。但是引用实践在大部分情况下是局部性的，比如不同实验室、部门或学科特有的引用行为。不同学科中的每篇论文平均引用数不同，引用在文本中的表示方式以及被引价值也存在显著差别。比如，在分子生物学领域称得上恰当引用的实践，在研究伦理学或科学策略中是不被接受的。在阅读相近学科的论文时，要尊重其引用规范和惯例。如果你的研究被另一个领域的科学家引用了，则在另一个不同的引用文化中评估该引用。