大数据文摘授权转载自数据实战派
作者:KLAUDIA JAZWINSKA
译者:李玉婷
关于计算机技术(如AI)对社会影响的研究,在很大程度上依赖于研究这些技术的公司的资金支持。
像谷歌、微软和 IBM 这样的公司,每年花费数百万美元,赞助一些世界顶级机构在计算机科学(CS)和AI伦理学等领域的实验室、教职、博士生项目和会议。84%的 CS 教授多少接受一些行业资助。
科技公司的产品是否会被与某种顾虑相关联,以及一项信息是否可能产生大规模的社会反应,都被这些因素所影响。
随着对这些利益冲突认识的加深,我们看到,越来越多的 CS 学者呼吁将该学科与大型科技公司的议程进行一定的切割。然而,鉴于 CS 学术界对科技巨头资金的依赖程度,这一点并不容易。
如下所述,一个更容易实现而又有价值的目标,可能是在会议等场合引入更好的保障措施,以减少企业对重要研究的不当影响。
我将分两部分阐述我的观点。
首先,在这篇文章中,我将:
对有关大公司在 CS 研究中主导地位的讨论进行简要概述。
使用我编制的一个数据集,说明会议——计算机科学领域知识共享的重要舞台——在经济上对世界上最强大的一些科技公司的依赖程度。
在另一篇文章中,我将提出我的建议,即可以采取哪些措施来尽量减少企业资助对 CS 研究带来的潜在寒蝉效应或议程设置效应。
对大公司影响力担忧的简短调查
依靠大公司和他们所控制的资源,会对提出、资助和发表的 CS 研究的种类造成重大限制。
科技行业在决定什么方向是否值得研究,或者问题框架方面起着很大的作用。例如,一家科技公司对隐私的定义,可能与消费者权利倡导者使用的定义有很大区别。
但如果该公司正在确定想要赞助的研究类型,它可以选择资助符合或支持其自身解释的提案。
因此,什么是合理的研究范围,是由其对科技公司的价值决定的。对于这些公司来说,资助那些他们认为比较边缘的问题或者与他们的优先事项无关的学术研究,是缺乏动力的。
2020 年一项关于AI研究的调查发现,“在AI方面,公司已经大大增加了企业的研究”,形式包括公司层面的出版物以及与精英大学的合作。Birhane 等人的分析说明了这一趋势,研究称“企业的存在感有实质性增加”。在 2018-19 年,近 80%的论文与企业有某种联系,无论是作者关系还是资金。此外,分析发现,在最终获得最多引用的会议论文中,企业存在更为明显。
Birhane 等人写道:“机器学习最常被阐述的价值......如性能、泛化和效率,可能不仅促成和促进了大型科技公司目标的实现,还抑制了诸如慈善、正义和包容等方向的价值。”
他曾是谷歌的员工,后来成为联邦贸易委员会的AI高级顾问。她认为,科技公司希望压制批评者并抵御日益增长的监管压力,渴望通过资助有利研究以传播其技术的社会影响。
这导致了企业对实验室、教职、研究生项目和会议的广泛赞助——所有这些都依赖于公司的资金及数据和计算资源。这种对科技研究的行业垄断——即企业以符合其自身进程的方式战略性地资助研究或公共活动,被 Thao Phan 等学者描述为“慈善资本主义”。
此外,正如 Whittaker 所说,科技行业在 CS 研究中的主导地位“有可能在最需要的时候,剥夺一线群体、政策制定者和公众对AI的成本、后果及其行业的重要认知”。
认识到这一威胁,Timnit Gebru 和 Alex Hanna 等其他前谷歌员工,主动发起了分布式AI研究所,努力为“独立的、以群体为基础的AI研究创造空间,不受大公司的普遍影响”。
我仍旧想要说明,接受一个与自己价值观不完全一致的组织的资助,并不一定意味着自己的研究会受到影响。
企业对AI研究的资助本身并不坏,不接受大公司资金的学者,也可能做出有道德问题的研究。此外,接受大科技公司资助的个人,仍然可以对企业产品及其对社会的影响持批评态度。
然而,我同意 Moshe Y. Vardi 等学者的观点,即必须努力解决接受来自公司的AI伦理学等研究资金的内在矛盾,公司利益可能与公共利益相悖。
在最近的一篇文章中,作为《ACM 通讯》的高级编辑,Vardi 敦促他的同事们更加批判性地思考他们的研究与“监控资本主义公司”的关系。
他写道:“今天计算机科学所面临的最大问题,不是AI技术不道德,尽管机器偏见是一个严重的问题,而是AI技术被强大的公司用来支持一种可以说是不道德的商业模式。”
分析:FAGMA 公司主导了会议赞助
开始解决这些利益冲突的方法之一,是反思知识创造和交流的条件(比如学术会议),并批判性地、公开地思考接受控制自己研究对象的行业资助所固有的妥协和权衡。
在计算机科学领域,会议是与本学科其他人分享自己研究的主要场所。因此,赞助这些会议,使公司对技术前沿情况保有的影响力和洞察力。
为了更好地了解谁是这一领域的主要参与者,我查阅了前 25 名 CS 会议的网站(根据 H-5 指数和影响力分数),汇编了 2019-2021 年对其提供资金支持的所有组织的信息。我发现,最频繁和最慷慨的赞助商,大多数是强大的科技公司,他们往往在每次会议上捐赠数万美元。
这个表格包含了前 25 个最频繁的赞助商的赞助数据。
在过去三年中支持不同会议次数最多的 10 个赞助商中,有 5 个是“FAGMA”公司(Facebook、苹果、谷歌、微软、苹果)。如果算上谷歌母公司 Alphabet 的子公司 DeepMind,则有 6 个。前 10 名中没有非营利组织、政府科学资助机构或来自中美以外的赞助商。
总的来说,在前 25 个 CS 会议最频繁且最慷慨的支持者中,唯一的非科技/非企业捐助者是美国国家科学基金会,它赞助了五个不同的会议(总共 11 个),捐款通常在 15,000 美元至 25,000 美元之间。
除了在会议宣传材料上列出他们的公司名称和标志外,顶级赞助商(他们的捐赠往往超过 50,000 美元)还能得到一些好处,如赞助奖品或学生补助的机会、免费的注册和私人会议室、对招聘机会感兴趣的会议注册者数据库准入资格、虚拟展位或优先展览空间、广告机会和新闻稿支持,以及在“参展商板”上获得与会者指标。
例如,一个向 2021 年 Conference on Human Factors in Computing Systems(CHI)捐赠 5 万美元或更多的“英雄赞助商”,将获得 34 种不同的好处,累积起来创造了在整个活动期间持续接触和影响与会者的机会。
很难准确估计每家公司到底向这些会议捐赠了多少钱,因为这些数字并没有持续公开。
一些会议只公布了支持者的名单,但没有详细说明金额。
还有一些会议指定了赞助级别,如“白金”或“钻石”,但每个级别的赞助金额因会议和年份而异。
当金额被提及时,往往只公开几千美元的大概范围——例如,2021 年 SIGMOD/PODS 会议的白金赞助商可能提供了 16,000 美元到 31,999 美元之间的任何金额。此外,我们很难深入了解这些资金的具体使用情况。
鉴于大型科技公司与学术界之间的财务联系,期望 CS 学者完全抵制接受任何行业资助可能是不现实的,相反,更实际的做法可能是共同努力,为赞助建立更高标准和透明度。
在另一篇文章中,我将建议采取一些措施,以尽量减少企业资助对 CS 研究带来的潜在寒蝉效应或议程设置效应。
注 : 世界上排名前 25 位的 CS 会议中,有 6 个是由 ACM,即美国计算机协会组织的。2019-2021 年,许多会议主要由美国科技公司资助,如苹果、亚马逊、Facebook、谷歌、IBM 和微软,以及中国的阿里巴巴、百度、字节跳动和华为等。