Sci-Hub背后的“盗版女王”:只要人身安全,就会坚持下去

2018 年 3 月 5 日 科研圈



编辑   陈翔宇  

校审   黄珊

来源   DeepTech深科技(mit-tr)


所有有志于从事学术研究的人都无法避开学术期刊。但绝大多数学刊都是付费阅读的,而且价格一直在大幅增长。


业内不少人士认为,由于大多数科学研究都是由政府用税金资助的,付费学刊让科学成为了一个需要纳税人与科学家双重付费的产品。




可是,如果你不想为一篇论文付费,那么你的合法选择其实不多:你可以求论文作者给你一份(这是个灰色地带),试图在免费的开放获取学刊中找到这篇论文,或者在开放获取文库(比如 Arxiv.org)中查看作者是否上传过预印版。但这些依然不是长久之计。


许多人有所不知的是,把所有学刊的订阅费加在一起,一所大学每年要向出版集团支付 50 万 200 万美元。


就连财大气粗的哈佛大学,在 2012 年也曾表示他们已经难以承担越来越贵的学刊,尤其是两个在 6 年里涨价 145% 的出版集团。德国康斯坦茨大学(University of Konstanz)甚至因为价格在 5 年里增长了 30%,在 2014 年全面停止订阅 Elsevier 的学刊。


这些学术出版集团之所以可以大肆涨价,是因为该行业已经实现了寡头垄断。


据研究显示,全球一半以上的研究成果都是由 5 大集团出版的:Reed-Elsevier(里德-爱思唯尔),Wiley-Blackwell,Springer(施普林格),Taylor & Francis(泰勒弗朗西斯),以及根据采取标准的不同,American Chemical Society(美国化学学会)或 Sage Publishing(塞奇出版公司)。


要知道,在 1973 年,仅有 20% 的研究论文是由前五名出版公司所出版的;社会科学领域甚至只有 10% 出版于这“5 大”。如今,几乎所有学术领域都至少有一半的研究成果出版于 5 大出版集团,而一些领域,比如心理学,甚至有 71% 的论文发表于 5 大集团的学刊中。


与一切垄断一样,这种权利给这几大出版集团们带来了大量的利润:Elsevier 的市值已涨到 350 亿美元,其科学出版业务的净利润率更是高达 39%。相比之下,Facebook 与谷歌等科技巨头的净利润率仅有 20% 左右,利润极高的苹果公司也只有 30% 出头。


不过,有垄断的地方,就有反抗者,如果反抗者拥有力挽狂澜的能力,他/她又无疑会成为既得利益者们的公敌。


如今,有一个人正在遭受全球各大学术出版集团的敌视与攻击,她被这些机构视为小人,却又被认为是一名“侠盗”。


她创办了全球最大的盗版学术论文网站 Sci-Hub,她的名字叫做 Alexandra Elbakyan。



出版商视她为死敌


在俄罗斯国立高等经济学院里一间其貌不扬的宿舍中,住着四名学生与一只猫。而这间宿舍却又十分与众不同,因为与学生们同处一室的还有一台装有 13 个硬盘的服务器。


就是这么一个不起眼的服务器,内含超过 6400 万篇全球任何人都可以免费下载的研究论文,支撑着 Sci-Hub 的运作。




在 2015 年 6 月,Elbakyan 因为 Sci-Hub 收到了一封来自全球最大的学术出版集团 Elsevier(爱思唯尔)的邮件。这封邮件的抬头就是“YOU HAVE BEEN SUED”(你已被告)。


对于拥有超过 2500 个几乎覆盖了所有学术领域的学刊的 Elsevier 来说,断人财路的 Sci-Hub 是比其他竞争对手还要可恨的死敌:读者需要为每篇属于 Elsevier 的论文支付 31.5 美元才能阅读,而 Sci-Hub 则完全免费。但对于志在通过一切手段推动科学成果的分享与发展的 Elbakyan 来说,这封电邮几乎没有给她带来任何影响。毕竟,她人在哈萨克斯坦,而这场官司则是在美国。


2015 年的这场官司最大的后果,就是为 Elbakyan 与她的网站带来无以伦比的人气。这些人气,使 Sci-Hub 这个仅成立了 6 年的网站成为了全球最大的开放获取(Open Access)学术资源网站:它 6450 万篇论文代表了全球所有被发表的研究中的 2/3,并向所有人免费开放




但是,与 Sci-Hub 的人气随之即来的则是全球各大学术出版集团的持久战。针对这个死敌,这些集团开始调集一切资源,利用法律武器来压迫网络供应商,支付处理公司,域名管理公司等一切与 Sci-Hub 有业务往来的公司,试图把它杀死。


在这场卷席了全球大量的科学家,维权人士,媒体,以及出版方的学术研究所有权的争议中,人们几乎没有听到来自 Elbakyan 的声音。作为当下全球最大的侵权案的当事人,几乎没有人知道她是谁。


Sci-Hub 的前世今生


在 Elbakyan 成为全球最大的“侵权者”之前,她曾是一位编程能力极强的科学家。当时还是俄罗斯科学院的一名研究生的她,遇到了全球所有学生在做研究时都会面临的一个难关:“付费墙”。“我是在 2009 年首次接触到研究论文的分配和共享”,Elbakyan 曾透露。


而 Sci-Hub 的前身正是出自于她在大学期间,为了绕开付费墙而编写的一个利用麻省理工的订阅权来下载神经科学电子书的脚本。她经常在俄罗斯的一个生物学论坛上分享这些电子书。这一举动为 Sci-Hub 日后的诞生打下了坚固的基础。


Sci-Hub 是作为对我之前人工操作所进行的一个自动化处理而诞生的”,Elbakyan 说道。而“任何人都可以一键下载他们想要的论文”这一期望则成为了 Sci-Hub 成长的养分:该论坛的用户立即爱上了这款方便利民的工具,并开始向外部安利它。


当 Elbakyan 在 2011 年正式成立 Sci-Hub 网站时,这仅是她的一个业余项目


实际上,最初的 Sci-Hub 是个十分低效网站:没有中央数据库的 Sci-Hub 需要为每个用户的每个请求重新下载一份论文;如果某个高校的订阅账户下载不了这份论文,用户还需要换个高校再次尝试。


在 2012 年,Elbakyan 与付费书籍盗版网站 LibGen 达成了合作关系,将 Sci-Hub 所下载的所有论文都上传到 LibGen 的服务器中,为 Sci-Hub 的扩张攒下了大量的弹药。在 2013 年,Sci-Hub 在中国的人气迎来爆炸式的增长时,Elbakyan 直接将 LibGen 变成了 Sci-Hub 的数据库:先在 LibGen 里面搜索用户想要的论文是否存在,如果存在,就直接从 LibGen 中下载


就这样,Sci-Hub 一直以与 LibGen 共存的状态运营着,直到后者因为一名网管因为癌症去世而被关闭。失去了数据库的 Elbakyan 这次选择自己干。她通过众筹捐款拿到足够购买大量硬盘的钱,建立起了自己的数据库,并反向复制了 LibGen 里面 2100 多万篇论文。其中,有 100 多万篇论文来自于 Sci-Hub。


Elbakyan 一直不肯透露她是如何收集到如此海量的论文的,仅表示其中绝大多数来自于利用图书馆与高校的订阅账号,并且手上有着“大约 400 多个高校”的账号




有些人认为,Elbakyan 手上的大多数账号都属于被高校人员泄露,或是从他们手上骗取得来的。美国马凯特大学(Marquette University)的一名行政人员甚至表示,他曾见到过来自 Sci-Hub 的钓鱼邮件。


对此,Elbakyan 声色俱厉的进行了否认,表示许多高校学者甚至主动将账号提供给她用。这也可以解释她之前曾表示的,Sci-Hub 可以“直接从出版商那里下载一些论文”。


传统出版商的反击


现在来看,2013 年似乎是 Sci-Hub 和 Elbakyan 的首个转折点。一方面,Sci-Hub 在中国人气的暴增使它迅速扩大,另一方面,Elbakyan 也首次迎来了出版集团的挑战。


Elsevier 向 Paypal,也就是 Sci-Hub 收取捐赠的支付处理公司提出了抗议。据 Elsevier 后来的当庭供词显示,他们已得知 Sci-Hub 曾向学生购买他们的高校账号,用来下载付费学术论文内容。此外,Elbakyan 还曾经通过 Paypal 收取多笔资金,用来购买将自己伪装成学生的代理服务器。当 Paypal 收到抗议后,他们主动关闭了 Elbakyan 的账户。



紧接着,Elsevier 也开始向网络供应商和其他支付处理公司施展压力。除了主动向各公司施压,Elsevier 还一直在寻求法律武器。他们与美国出版商协会(AAP)在美国国会进行了大量的游说。希望国会通过可以让出版公司更轻易地要求网络供应商、搜索引擎、DNS 服务等公司屏蔽指定网站,或者要求广告公司和支付处理公司停止与盗版者业务来往的法案。从出版公司的角度来看,增加自己执行版权法的能力来维护自己版权是天经地义的。


可惜,面对社会各界对于网络中立的要求,Elsevier 所求的法案并没有通过。


但是,无法从律法方面得到的,却还可以通过执法先例获取:在 2015 年,Elsevier 作为英国出版商协会的一员,与美国出版商协会和美国化学学会(ACS)成功的让法庭签发针对 6、7 家盗版网站的禁令,要求网络供应商向用户屏蔽这些网站。


对于 Elsevier“赶尽杀绝”的态度,由出版集团成立的“合理分享联盟”(Coalition for Responsible Sharing)的发言人表示,大型出版商们并不反对开放获取,因为“每个成员都有自己的开放获取学刊,并且允许科学家们向开放获取网站上传没有经过同行审批过得预印本”。


“联盟”的发言人表示,面临着大肆侵权,出版商们已经十分耐心了。


开始接受比特币捐赠


如今,Sci-Hub 越来越广的读者范围,也意味着 Elbakyan 所受到的敌视越来越凶。不过,当 Elsevier 剑指 Sci-Hub 之时,这个网站已经不再是 Elbakyan 的兼职项目了。


它已经成为她的使命。



 Elbakyan 坚信,科学需要成果分享。毕竟,科学史上最伟大的发现都是“站在巨人的肩膀上”,从他人所分享的成果中得来的。对她来说,科学只能在一种环境里兴旺:当科学家们把他们的成功大声的向他人喊出来。


她发现:“通过 LibGen,我看到了收集上千万篇学术论文的可能。所以为什么我不能把目前交叉参考数据库中所有的论文都下载一遍呢?”


所幸的是,虽然她失去了 PayPal,但是她却恰好迎来了另一种网络支付手段的崛起:比特币(避开中央“强权”的控制也正是比特币的功能之一)。信息安全专业出身的 Elbakyan,同样继承了俄罗斯黑客的超强战斗力,她选择了启用比特币来躲避监管:因为诉讼,Sci-Hub.org 的域名在 2015 年 10 月被迫关闭,但现在仍可以通过 sci-hub.io 访问网站服务,同时 Sci-Hub 接受比特币捐赠。


除此之外,她还曾将 Sci-Hub 的数据库复制了多个备份,并且从头重写了 Sci-Hub 的代码:用户也不再需要手动在新版的 Sci-Hub 上搜索论文,他们可以直接将 Sci-Hub 指向所需的论文,然后它会自动切换大学代理服务器来寻找可以下载所需论文的那一个,并自动下载。


面对财大气粗、影响力深厚、律师团庞大的 Elsevier 的诉讼,Elbakyan 表示她没有一丝打赢这场官司的可能。所以她不需要去和 Elsevier 斗,仅需要在远处冷眼观望。毕竟,Elsevier 的案子是场民事诉讼,为此从他国向美国引渡当事人是非法的。


不过后来,Elbakyan 想出来了一个更好的方式绕开高校屏蔽 IP 的手段。据 Elsevier 技术人员的证词,Sci-Hub 不再直接使用高校的代理服务器从 Elsevier 下载论文,而是仅用它们来获得授权密匙。



获得密匙后,Sci-Hub 会使用一个不同的 IP 地址下载论文,大幅度减少 Sci-Hub 手上高校账户被识别的可能。直到开庭,Elsevier 还没有想出一个好的办法来解决这个问题。不过,找到 Sci-Hub 另外一个痛点的他们也不需要技术手段了。


法律+釜底抽薪的双重打击


2015 年 6 月,Elsevier 赢得诉讼,Elbakyan 被判需向其支付 1500 万美元的罚金


一周后,她发现美国化学学会(ACS)也对她发起了诉讼。ACS 是 Sci-Hub 覆盖率最大的学刊:其 98.8% 的论文都能在 Sci-Hub 上找到。2015 年 11 月,ACS 被判赢得 480 万美元的罚金。


其实对 Elbakyan 来说,罚金并不重要;因为不论是 1500 万,还是 480 万,在他国居住的 Elbakyan 都支付不起,也不需要支付。



但是,这两场诉讼却对 Sci-Hub 造成了巨大的影响:Elsevier 一案让 Elbakyan 失去了 Sci-Hub.org 以及 Sci-Hub 推特账号的所有权,ACS 一案则让“任何互联网搜索引擎,网页寄存服务商,网络供应商,以及域名注册商禁止一切可以让 Sci-Hub 运营的行为。”


法律的大棒打下来了。


对于这一判决,电子前沿基金会(EFF)等科技法律组织立刻发表了异议,表示这给版权所有方太大权力。成员包括谷歌,优步,微软等科技巨头的美国计算机及通信行业协会(CCIA)甚至递交了一份“法庭之友”(amicus brief),反对 ACS 一案的禁令。


在 ACS 结案后,多个 Sci-Hub 域名(.ac, .io, .cc,.bz)都被屏蔽了。Elbakyan 甚至需要在推特上公开告诉用户如何绕开域名屏蔽。


但是她表示,Sci-Hub 的命硬着呢:她手上有大量的域名,并且对其数据库进行了多个备份。就算所有的搜索引擎都对 Sci-Hub 进行屏蔽也没关系,因为只有 25% 的 Sci-Hub 用户来自于搜索引擎的引导。


Sci-Hub 往往被成为“科学界的 Pirate Bay”(注:全球最大的 BT 种子网站),而 Pirate Bay 则在被警察突袭两次后最终倒闭。


今年春节,Elbakyan 还在 Sci-Hub 上送出了她对中国读者的新春祝福


对此,Elbakyan 表示,“只要我不出事,我就会将 Sci-Hub 坚持下去”。而就算她因不可抗拒的原因无法继续下去,“这个项目的主要资源,即科学论文,已经被公布在网上了。”


至于出版商们,他们似乎已经将目光越过了盗版方,直接对科学家们“下手”。从 2015 年期,包括 ACS 与 Elsevier 在内的绝大多数出版商都发表了一份“论文分享自愿原则”,告知在他们在期刊上发表论文的科学家们如何可以分享研究成果。




乍眼一看,这些原则十分利于提高科研成果的分享与交流。但进一步的细读显示,这些原则只提到了科学家们如何可以在研究小组范围内分享论文,而非广大的科学社区。甚至 Peerj、Arxiv以及 bioRxiv 等大型开放获取文库都没有被提到一丝一毫。


不过,机关算尽的出版商们最终很可能得不偿失,因为他们的措施并没有解决这个问题最核心的所在:科学家们对付费墙将他们成果隐藏起来的失望与愤怒


在另一边,拥有群众大势的 Sci-Hub 很可能获得公众与科学社区更大的欢迎。虽然 Elbakyan 目前处于法律的另一面,但是谁能保证,失望之极的科学家们不会有一天直接把他们自己的账户直接交给 Sci-Hub 的“盗版女王”呢?



阅读更多


▽ 故事

· “2017年度学术公众号”TOP 10重磅发布 | 科研圈出品

· 别在实验室熬着了,“懒虫”更容易成功

· 解答奖金100万美元!你敢挑战这个物理学最难的方程之一吗?

· 量子计算陷入难解困境,未来发展何去何从?

▽ 论文推荐

· 青少年对社交媒体的使用,可能比我们想象的更聪明 | Sport, Education and Society 论文推荐

· 吴岳良院士专访:太极计划与中国引力波研究 | NSR访谈

▽ 论文导读

· Nature 一周论文导读 | 2018 年 2 月 22 日

· Science 一周论文导读 | 2018 年 2 月 23 日


内容合作请联系

keyanquan@huanqiukexue.com

登录查看更多
0

相关内容

AI创新者:破解项目绩效的密码
专知会员服务
33+阅读 · 2020年6月21日
专知会员服务
145+阅读 · 2020年6月15日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
深度解读 | 美国打压华为这事水很深——什么是华为?(1)
混沌研习社广州分社
21+阅读 · 2019年6月27日
三安光电到底发生了什么?
商业人物
7+阅读 · 2019年1月28日
教辅巨头沉浮录(1978-2018)
创业家
3+阅读 · 2019年1月8日
终于有人把云计算、大数据和人工智能讲明白了
Python开发者
3+阅读 · 2018年6月13日
终于有人把云计算、大数据和人工智能讲明白了!
大数据技术
7+阅读 · 2018年4月2日
Deep Co-Training for Semi-Supervised Image Segmentation
Arxiv
6+阅读 · 2019年8月22日
Arxiv
6+阅读 · 2019年4月8日
Arxiv
19+阅读 · 2018年6月27日
Arxiv
7+阅读 · 2018年1月18日
VIP会员
相关VIP内容
AI创新者:破解项目绩效的密码
专知会员服务
33+阅读 · 2020年6月21日
专知会员服务
145+阅读 · 2020年6月15日
【复旦大学-SP2020】NLP语言模型隐私泄漏风险
专知会员服务
24+阅读 · 2020年4月20日
广东疾控中心《新型冠状病毒感染防护》,65页pdf
专知会员服务
18+阅读 · 2020年1月26日
阿里巴巴达摩院发布「2020十大科技趋势」
专知会员服务
106+阅读 · 2020年1月2日
2019中国硬科技发展白皮书 193页
专知会员服务
81+阅读 · 2019年12月13日
相关资讯
Top
微信扫码咨询专知VIP会员