过往的研究大多用主题词的词频检测学术热点与趋势,但是词频往往会受到研究者数量和研究周期的影响,比如,在生态学中,既包含微观的分子生态学研究,也包含宏观的生态系统生态学研究,分子生物学实验相对于长期野外考察而言周期较短,研究者也较多,因此相关主题的发表数量也偏多。如果无差别地使用词频作为评价标准,就会得到微观生态学主导了生态学研究领域的错误结论。
使用基于关键词共现网络的节点度计算,并用节点度代替词频来评价一个主题词的流行度,有利于减少上述偏误。因为节点度的计算,关心的是某一个主题词能够与其他不同主题词发生联系的概率,而不是单纯地计数。比如,在某一个关键词共现网络中,“DNA”和“RNA”可能共同出现了1000次,但是在网络节点度计算中,彼此只为对方的节点度增加了1个单位;而“中国”这个关键词可能与很多关键词共现的次数不超过5次,但是它能够跟“美国”、“经济”、“教育”、“科技”、“一带一路”等各种各样的关键词发生联系,因此它更有可能成为未来的热点主题。
将关键词共现网络视为动态变化的网络,能够发现典型的“强者更强”的马太效应。也就是说,已经大量出现的研究主题具有累积效应,能够让其在未来研究中结合更多新的主题进行研究。比如“全球变化”是生态学领域中的热点关键词,它已经与各种各样的关键词同时出现在一篇文章中(反映的是各个领域的科学家都在把它们的研究放在全球变化的背景下论述,进而对相关问题进行解释)。因此,“全球变化”在未来也将会与更多不同的主题结合,进而产生新的研究。
“适者更强”的效应在上述网络中是真实存在的。实证分析发现,考虑了主题内在适用性的模型(PAFit)比其他模型的预测能力(预测未来的研究热点)更强。
合作事宜:market@stimes.cn
投稿事宜:tougao@stimes.cn