她是Sci-Hub背后的“盗版女王”,被出版机构视为死敌的“侠盗”

2018 年 3 月 10 日 德先生

本文来源:DeepTech深科技(mit-tr)

所有有志于从事学术研究的人都无法避开学术期刊。但绝大多数学刊都是付费阅读的,而且价格一直在大幅增长。


业内不少人士认为,由于大多数科学研究都是由政府用税金资助的,付费学刊让科学成为了一个需要纳税人与科学家双重付费的产品。




可是,如果你不想为一篇论文付费,那么你的合法选择其实不多:你可以求论文作者给你一份(这是个灰色地带),试图在免费的开放获取学刊中找到这篇论文,或者在开放获取文库(比如 Arxiv.org)中查看作者是否上传过预印版。但这些依然不是长久之计。


许多人有所不知的是,把所有学刊的订阅费加在一起,一所大学每年要向出版集团支付50万到200万美元。


就连财大气粗的哈佛大学,在2012年也曾表示他们已经难以承担越来越贵的学刊,尤其是两个在2年里涨价145%的出版集团。德国康斯坦茨大学(University of Konstanz)甚至因为价格在5年里增长了30%,在2014年全面停止订阅Elsevier的学刊。


这些学术出版集团之所以可以大肆涨价,是因为该行业已经实现了寡头垄断。


据研究显示,全球一半以上的研究成果都是由5大集团出版的:Reed-Elsevier(里德-爱思唯尔),Wiley-Blackwell,Springer(施普林格),Taylor & Francis(泰勒弗朗西斯),以及American Chemical Society(美国化学学会)或Sage Publishing(塞奇出版公司)。


要知道,在1973年,仅有20%的研究论文是由前五名出版公司所出版的;社会科学领域甚至只有10%出版于这“5大”。如今,几乎所有学术领域都至少有一半的研究成果出版于5大出版集团,而一些领域,比如心理学,甚至有71%的论文发表于5大集团的学刊中。


与一切垄断一样,这种权利给这几大出版集团们带来了大量的利润:Elsevier的市值已涨到350亿美元,其科学出版业务的净利润率更是高达39%。相比之下,Facebook与谷歌等科技巨头的净利润率仅有20%左右,利润极高的苹果公司也只有30%出头。


不过,有垄断的地方,就有反抗者,如果反抗者拥有力挽狂澜的能力,他/她又无疑会成为既得利益者们的公敌。


如今,有一个人正在遭受全球各大学术出版集团的敌视与攻击,她被这些机构视为小人,却又被认为是一名“侠盗”。


她创办了全球最大的盗版学术论文网站Sci-Hub,她的名字叫做Alexandra Elbakyan。



出版商视她为死敌


在俄罗斯国立高等经济学院里一间其貌不扬的宿舍中,住着四名学生与一只猫。而这间宿舍却又十分与众不同,因为与学生们同处一室的还有一台装有13个硬盘的服务器。


就是这么一个不起眼的服务器,内含超过6400万篇全球任何人都可以免费下载的研究论文,支撑着Sci-Hub的运作。




在2015年6月,Elbakyan因为Sci-Hub收到了一封来自全球最大的学术出版集团 Elsevier(爱思唯尔)的邮件。这封邮件的抬头就是“YOU HAVE BEEN SUED”(你已被告)。


对于拥有超过2500个几乎覆盖了所有学术领域的学刊的Elsevier来说,断人财路的Sci-Hub是比其他竞争对手还要可恨的死敌:读者需要为每篇属于Elsevier的论文支付31.5美元才能阅读,而Sci-Hub则完全免费。但对于志在通过一切手段推动科学成果的分享与发展的Elbakyan来说,这封电邮几乎没有给她带来任何影响。毕竟,她人在哈萨克斯坦,而这场官司则是在美国。


2015年的这场官司最大的后果,就是为Elbakyan与她的网站带来无以伦比的人气。这些人气,使Sci-Hub这个仅成立了6年的网站成为了全球最大的开放获取(Open Access)学术资源网站:它6450万篇论文代表了全球所有被发表的研究中的2/3,并向所有人免费开放。




但是,与Sci-Hub的人气随之即来的则是全球各大学术出版集团的持久战。针对这个死敌,这些集团开始调集一切资源,利用法律武器来压迫网络供应商,支付处理公司,域名管理公司等一切与Sci-Hub有业务往来的公司,试图把它杀死。


在这场卷席了全球大量的科学家,维权人士,媒体,以及出版方的学术研究所有权的争议中,人们几乎没有听到来自Elbakyan的声音。作为当下全球最大的侵权案的当事人,几乎没有人知道她是谁。


Sci-Hub的前世今生


在Elbakyan成为全球最大的“侵权者”之前,她曾是一位编程能力极强的科学家。当时还是俄罗斯科学院的一名研究生的她,遇到了全球所有学生在做研究时都会面临的一个难关:“付费墙”。“我是在2009年首次接触到研究论文的分配和共享”,Elbakyan曾透露。


而Sci-Hub的前身正是出自于她在大学期间,为了绕开付费墙而编写的一个利用麻省理工的订阅权来下载神经科学电子书的脚本。她经常在俄罗斯的一个生物学论坛上分享这些电子书。这一举动为Sci-Hub日后的诞生打下了坚固的基础。


Sci-Hub是作为对我之前人工操作所进行的一个自动化处理而诞生的”,Elbakyan说道。而任何人都可以一键下载他们想要的论文”这一期望则成为了Sci-Hub成长的养分:该论坛的用户立即爱上了这款方便利民的工具,并开始向外部安利它。


当 Elbakyan 在 2011 年正式成立 Sci-Hub 网站时,这仅是她的一个业余项目


实际上,最初的Sci-Hub是个十分低效网站:没有中央数据库的Sci-Hub需要为每个用户的每个请求重新下载一份论文;如果某个高校的订阅账户下载不了这份论文,用户还需要换个高校再次尝试。


在2012年,Elbakyan与付费书籍盗版网站LibGen达成了合作关系,将Sci-Hub所下载的所有论文都上传到LibGen的服务器中,为Sci-Hub的扩张攒下了大量的弹药。在2013年,Sci-Hub在中国的人气迎来爆炸式的增长时,Elbakyan直接将LibGen变成了Sci-Hub的数据库:先在LibGen里面搜索用户想要的论文是否存在,如果存在,就直接从LibGen中下载。


就这样,Sci-Hub一直以与LibGen共存的状态运营着,直到后者因为一名网管因为癌症去世而被关闭。失去了数据库的Elbakyan这次选择自己干。她通过众筹捐款拿到足够购买大量硬盘的钱,建立起了自己的数据库,并反向复制了LibGen里面2100多万篇论文。其中,有100多万篇论文来自于Sci-Hub。


Elbakya一直不肯透露她是如何收集到如此海量的论文的,仅表示其中绝大多数来自于利用图书馆与高校的订阅账号,并且手上有着“大约400多个高校”的账号。




有些人认为,Elbakyan手上的大多数账号都属于被高校人员泄露,或是从他们手上骗取得来的。美国马凯特大学(Marquette University)的一名行政人员甚至表示,他曾见到过来自Sci-Hub的钓鱼邮件。


对此,Elbakyan声色俱厉的进行了否认,表示许多高校学者甚至主动将账号提供给她用。这也可以解释她之前曾表示的,Sci-Hub可以“直接从出版商那里下载一些论文”。


传统出版商的反击


现在来看,2013年似乎是Sci-Hub和Elbakyan的首个转折点。一方面,Sci-Hub在中国人气的暴增使它迅速扩大,另一方面,Elbakyan也首次迎来了出版集团的挑战。


Elsevier向Paypal,也就是Sci-Hub收取捐赠的支付处理公司提出了抗议。据Elsevier后来的当庭供词显示,他们已得知Sci-Hub曾向学生购买他们的高校账号,用来下载付费学术论文内容。此外,Elbakyan还曾经通过Paypal收取多笔资金,用来购买将自己伪装成学生的代理服务器。当Paypal收到抗议后,他们主动关闭了Elbakyan的账户。



紧接着,Elsevier也开始向网络供应商和其他支付处理公司施展压力。除了主动向各公司施压,Elsevier还一直在寻求法律武器。他们与美国出版商协会(AAP)在美国国会进行了大量的游说。希望国会通过可以让出版公司更轻易地要求网络供应商、搜索引擎、DNS服务等公司屏蔽指定网站,或者要求广告公司和支付处理公司停止与盗版者业务来往的法案。从出版公司的角度来看,增加自己执行版权法的能力来维护自己版权是天经地义的。


可惜,面对社会各界对于网络中立的要求,Elsevier所求的法案并没有通过。


但是,无法从律法方面得到的,却还可以通过执法先例获取:在2015年,Elsevier作为英国出版商协会的一员,与美国出版商协会和美国化学学会(ACS)成功的让法庭签发针对6、7家盗版网站的禁令,要求网络供应商向用户屏蔽这些网站。


对于Elsevier“赶尽杀绝”的态度,由出版集团成立的“合理分享联盟”(Coalition for Responsible Sharing)的发言人表示,大型出版商们并不反对开放获取,因为“每个成员都有自己的开放获取学刊,并且允许科学家们向开放获取网站上传没有经过同行审批过得预印本”。


“联盟”的发言人表示,面临着大肆侵权,出版商们已经十分耐心了。


开始接受比特币捐赠


如今,Sci-Hub越来越广的读者范围,也意味着Elbakyan所受到的敌视越来越凶。不过,当Elsevier剑指Sci-Hub之时,这个网站已经不再是Elbakyan的兼职项目了。


它已经成为她的使命。



Elbakyan坚信,科学需要成果分享。毕竟,科学史上最伟大的发现都是“站在巨人的肩膀上”,从他人所分享的成果中得来的。对她来说,科学只能在一种环境里兴旺:当科学家们把他们的成功大声的向他人喊出来。


她发现:“通过LibGen,我看到了收集上千万篇学术论文的可能。所以为什么我不能把目前交叉参考数据库中所有的论文都下载一遍呢?”


所幸的是,虽然她失去了PayPal,但是她却恰好迎来了另一种网络支付手段的崛起:比特币(避开中央“强权”的控制也正是比特币的功能之一)。信息安全专业出身的Elbakyan,同样继承了俄罗斯黑客的超强战斗力,她选择了启用比特币来躲避监管:因为诉讼,Sci-Hub.org的域名在2015年10月被迫关闭,但现在仍可以通过sci-hub.io访问网站服务,同时Sci-Hub接受比特币捐赠。


除此之外,她还曾将Sci-Hub的数据库复制了多个备份,并且从头重写了Sci-Hub的代码:用户也不再需要手动在新版的Sci-Hub上搜索论文,他们可以直接将Sci-Hub指向所需的论文,然后它会自动切换大学代理服务器来寻找可以下载所需论文的那一个,并自动下载。


面对财大气粗、影响力深厚、律师团庞大的Elsevier的诉讼,Elbakyan表示她没有一丝打赢这场官司的可能。所以她不需要去和Elsevier斗,仅需要在远处冷眼观望。毕竟,Elsevier的案子是场民事诉讼,为此从他国向美国引渡当事人是非法的。


不过后来,Elbakyan想出来了一个更好的方式绕开高校屏蔽IP的手段。据Elsevier技术人员的证词,Sci-Hub不再直接使用高校的代理服务器从Elsevier下载论文,而是仅用它们来获得授权密匙。



获得密匙后,Sci-Hub会使用一个不同的IP地址下载论文,大幅度减少Sci-Hub手上高校账户被识别的可能。直到开庭,Elsevier还没有想出一个好的办法来解决这个问题。不过,找到Sci-Hub另外一个痛点的他们也不需要技术手段了。


法律+釜底抽薪的双重打击


2015年6月,Elsevier赢得诉讼,Elbakyan被判需向其支付1500万美元的罚金


一周后,她发现美国化学学会(ACS)也对她发起了诉讼。ACS是Sci-Hub覆盖率最大的学刊:其98.8%的论文都能在Sci-Hub上找到。2015年11月,ACS被判赢得480万美元的罚金。


其实对Elbakyan来说,罚金并不重要;因为不论是1500万,还是480万,在他国居住的Elbakyan都支付不起,也不需要支付。



但是,这两场诉讼却对Sci-Hub造成了巨大的影响:Elsevier一案让Elbakyan失去了Sci-Hub.org以及Sci-Hub推特账号的所有权,ACS一案则让“任何互联网搜索引擎,网页寄存服务商,网络供应商,以及域名注册商禁止一切可以让Sci-Hub运营的行为。”


法律的大棒打下来了。


对于这一判决,电子前沿基金会(EFF)等科技法律组织立刻发表了异议,表示这给版权所有方太大权力。成员包括谷歌,优步,微软等科技巨头的美国计算机及通信行业协会(CCIA)甚至递交了一份“法庭之友”(amicus brief),反对ACS一案的禁令。


在ACS结案后,多个Sci-Hub域名(.ac, .io, .cc,.bz)都被屏蔽了。Elbakyan甚至需要在推特上公开告诉用户如何绕开域名屏蔽。


但是她表示,Sci-Hub的命硬着呢:她手上有大量的域名,并且对其数据库进行了多个备份。就算所有的搜索引擎都对Sci-Hub进行屏蔽也没关系,因为只有25%的Sci-Hub用户来自于搜索引擎的引导。


Sci-Hub往往被成为“科学界的Pirate Bay”(注:全球最大的BT种子网站),而Pirate Bay则在被警察突袭两次后最终倒闭。


今年春节,Elbakyan 还在 Sci-Hub 上送出了她对中国读者的新春祝福


对此,Elbakyan表示,“只要我不出事,我就会将Sci-Hub坚持下去”。而就算她因不可抗拒的原因无法继续下去,“这个项目的主要资源,即科学论文,已经被公布在网上了。”


至于出版商们,他们似乎已经将目光越过了盗版方,直接对科学家们“下手”。从2015年起,包括ACS与Elsevier在内的绝大多数出版商都发表了一份“论文分享自愿原则”,告知在他们在期刊上发表论文的科学家们如何可以分享研究成果。




乍眼一看,这些原则十分利于提高科研成果的分享与交流。但进一步的细读显示,这些原则只提到了科学家们如何可以在研究小组范围内分享论文,而非广大的科学社区。甚至Peerj、Arxiv以及bioRxiv等大型开放获取文库都没有被提到一丝一毫。


不过,机关算尽的出版商们最终很可能得不偿失,因为他们的措施并没有解决这个问题最核心的所在:科学家们对付费墙将他们成果隐藏起来的失望与愤怒。


在另一边,拥有群众大势的Sci-Hub很可能获得公众与科学社区更大的欢迎。虽然Elbakyan目前处于法律的另一面,但是谁能保证,失望之极的科学家们不会有一天直接把他们自己的账户直接交给Sci-Hub的“盗版女王”呢?



📚往期文章推荐

人工智能名人堂第49期 | 斯坦福研究院名人堂成员:Peter E. HaAI+区块链丨区块链如何解锁人工智能新领域

🔗浙江大学潘纲团队:感认知增强的智能机械手系统

🔗用强化学习转鸡蛋、转笔,OpenAI发起新的机械手挑战

🔗浙江大学吴朝晖:脑机融合系统综述

🔗马斯克下注的脑机接口,从科幻照进现实还要走多远?

🔗【平行讲坛】中科院王飞跃团队详解平行增强学习最新理论框架与案例

🔗福利丨别翻墙了,谷歌机器学习速成课25讲视频全集在此

🔗中科院王飞跃团队详解智联网:概念、问题和平台

🔗Science丨人工设计生命元件迎重大突破!跨膜蛋白三维设计成现实

🔗AI+区块链丨区块链如何解锁人工智能新领域

🔗王春在博士律师回应美国司法部新闻稿之声明全文 | 中英文


德先生公众号 | 往期精选


在公众号会话位置回复以下关键词,查看德先生往期文章!


人工智能|机器崛起|区块链|名人堂

虚拟现实|无人驾驶|智能制造|无人机

科研创新|网络安全|数据时代|人机大战

……

更多精彩文章正在赶来,敬请期待!


点击“阅读原文”,移步求知书店,可查阅选购德先生推荐书籍。

登录查看更多
0

相关内容

【ICML2020-哈佛】深度语言表示中可分流形
专知会员服务
12+阅读 · 2020年6月2日
【哈佛《CS50 Python人工智能入门》课程 (2020)】
专知会员服务
109+阅读 · 2020年4月12日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
2019中国硬科技发展白皮书 193页
专知会员服务
78+阅读 · 2019年12月13日
【CCL 2019】2019信息检索趋势,山东大学教授任昭春博士
专知会员服务
28+阅读 · 2019年11月12日
深度解读 | 美国打压华为这事水很深——什么是华为?(1)
混沌研习社广州分社
21+阅读 · 2019年6月27日
陆奇,YC 中国的 01 号员工 | 36氪独家
36氪
4+阅读 · 2018年8月15日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
学术汪必备的科研工具大集合!
清华大学研究生教育
9+阅读 · 2018年6月6日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
日媒羡慕中国或成AI领域第一大国:日本或落后一代人
人工智能机器人联盟
3+阅读 · 2018年1月21日
Arxiv
3+阅读 · 2018年8月27日
Arxiv
5+阅读 · 2018年1月23日
Arxiv
5+阅读 · 2015年9月14日
VIP会员
相关资讯
深度解读 | 美国打压华为这事水很深——什么是华为?(1)
混沌研习社广州分社
21+阅读 · 2019年6月27日
陆奇,YC 中国的 01 号员工 | 36氪独家
36氪
4+阅读 · 2018年8月15日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
学术汪必备的科研工具大集合!
清华大学研究生教育
9+阅读 · 2018年6月6日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
日媒羡慕中国或成AI领域第一大国:日本或落后一代人
人工智能机器人联盟
3+阅读 · 2018年1月21日
Top
微信扫码咨询专知VIP会员