【新智元导读】历时五年,29家出版商参加的学术参考文献的「开放获取」运动,大功初成!
经过为期5年的努力,学术出版物参考文献的「付费墙」有望彻底打破!
引用数据是学术论文的重要指标之一,虽然近年来论文「唯指标化」的现象有所改善,但作为最常用、标准化程度最高的标准之一,被引用数仍然是评价论文质量不可或缺的标准。
如果知道你的论文是否比其他人的引用率高,就需要查询相关基础数据,而要想获得基础数据,就得付钱。
过去几十年来,可靠的、结构化的论文作者和参考文献列表记录一直保留在两个订阅数据库中,即Web of Science和Scopus。
2017年,为解决这个问题,由29家学术出版商合作发起的I4OC运动,成立立了一个学术出版物开放式索引数据库Crossref,该数据库开放了1400万篇论文的参考文献。
维基媒体基金会研究主管达里奥-塔拉博雷利(Dario Taraborelli)说:「有史以来第一次,来自最大的出版商的大量学术引文数据可以向公众免费开放,没有任何版权限制。」
今年8月,Crossref宣布,目前数据库内已经涵盖了6000多万份期刊研究的DOI(数字对象标识符)参考文献列表,可以供研究人员和有需要的人士免费查看和重用。
现有主要科学期刊中的大多数文章都被Crossref索引了。
8月18日,Crossref在Twitter上宣布的这一里程碑,是2017年发起的开放引用倡议(Initiative for Open Citations,I4OC)5年来努力的结果。
多年来,开放科学的倡导者们一直致力于让论文的引用数据可以在自由的版权许可下被访问,这样不仅可以对这些数据进行引用,还可以分享这些分析的结果。
免费获取引文使研究人员能够确定研究趋势,让他们对哪些研究领域需要资金进行研究,还有助于发现科学家「操纵引用数」的不端行为。
伊利诺伊大学厄巴纳-香槟分校的信息科学家乔迪·施耐德说:「这真是太棒了!引文数据是科学研究的基石。」
他本人就曾用引文数据,来检查那些引用了被撤稿的论文的研究是否提到了这些论文已被撤回。
从Crossref这个名字不难看出,这个开放数据库开放的是引文,即通常所说的参考文献,引用的论文和被引用的论文本身可能仍处在付费墙后面,但它们的参考文献列表开放了。
截至目前统计,Crossref总共索引了大约1.34亿条记录,包括没有参考文献列表的文章。
这一里程碑意味着文献计量学家、科学计量学家和信息科学家将能够在最自由的版权许可(称为CC0)下以任何方式重新使用引文数据。也能让其他研究人员能够在他们的工作基础上进行研究。
在I4OC发起之前,研究人员通常必须获得许可才能从主要的学术数据库(如Web of Science和Scopus)获取数据,而且不能分享。
不过,Crossref文章引文的开放并不意味着世界上所有的学术内容现在都有开放的参考文献。
尽管大多数主要的国际学术出版商,包括爱思唯尔、施普林格-自然(《自然》出版商)和泰勒-弗朗西斯(著名学术著作出版机构),都在Crossref上加入了自家的论文索引,但还是有些出版机构没有被列入。
Taraborelli表示,下一个挑战将是鼓励那些还没有在Crossref存放参考数据的出版商将自家的内容索引也纳入进来,方便更多研究人员获取。
CrossRef上的记录是原始数据,没有经过组织或结构化处理,如果不是专家,要查询可能也要费一番周章。(比如查询某所大学在某年发表的了哪些最高引用率的论文)。
建立一个结构化的数据库,让更多普通用户能够方便查询,并充分利用这些数据,可能还需要几年时间。
参考资料:
https://twitter.com/i4oc_org/status/1560274192620085251
https://www.nature.com/articles/d41586-022-02926-y