本文研究了人工智能对创新的影响,利用美国一家大型企业研发实验室中随机引入的新材料发现技术,对 1,018 名科学家进行了实验。使用人工智能辅助的研究人员发现的材料数量增加了 44%,专利申请数量提高了 39%,下游产品创新增加了 17%。这些化合物具有更多新颖的化学结构,并促成了更多颠覆性的发明。然而,该技术对生产力分布的影响差异显著:虽然底层三分之一的科学家收益不大,但顶尖研究人员的产出几乎翻了一番。为探讨这些结果背后的机制,研究表明,人工智能自动化了 57% 的“创意生成”任务,使研究人员转而专注于评估模型生成的候选材料。顶尖科学家利用他们的领域知识优先选择有前景的 AI 建议,而其他研究人员则在测试错误结果上浪费了大量资源。这些发现表明了人工智能增强型研究的潜力,并突显了算法与专业知识在创新过程中的互补性。然而,调查结果显示,这些收益伴随一定的代价,82% 的科学家报告称,由于创造力减少和技能未被充分利用,他们的工作满意度有所下降。
人工智能的经济影响在很大程度上取决于 AI 技术是否不仅能改造商品和服务的生产,还能增强创新本身的过程(Aghion 等,2019;Cockburn 等,2019)。深度学习的最新进展在产生科学突破方面展现了潜力,尤其是在药物发现和材料科学等领域,在这些领域中,模型可以利用现有的大规模数据集进行训练(Merchant 等,2023;Mullowney 等,2023;DeepMind,2024)。然而,关于这些工具在现实世界中的发明影响,仍知之甚少。实际应用中研发的瓶颈、组织摩擦或可靠性不足可能会限制其有效性。因此,AI 对创新速度和方向的影响仍不确定。此外,这对科学家的影响尚不明确,取决于 AI 是否与人类专业知识互补或替代。为回答这些问题,我利用一家大型美国公司的研发实验室中向 1,018 名科学家随机引入的材料发现 AI 工具。该实验室专注于材料科学在医疗、光学和工业制造中的应用,研究人员拥有化学、物理和工程学的高级学位。传统上,科学家通过耗时且昂贵的试错系统发现材料,需要构思多种潜在结构并测试其性质。该 AI 技术利用深度学习的发展来部分自动化此过程。该模型基于现有材料的成分和特性进行训练,生成具有指定特性的新化合物“配方”。科学家随后评估这些候选材料并合成最有前景的选择。一旦创造出有用的材料,他们会将其整合到新的产品原型中,进行开发、扩展并推向商业化。从 2022 年 5 月开始,该实验室分三批推广该工具。研究小组被随机分配到不同的批次中,使我可以通过比较已处理和尚未处理的科学家来确定该技术的效果。各批次在教育、经验和过往绩效等可观察变量上是均衡的,确认了随机化的成功。我利用 R&D 各阶段的详细数据,研究了 AI 对材料发现的影响及其在专利和产品创新方面的下游影响。使用 AI 辅助的科学家发现的材料数量增加了 44%。这些化合物的性能优越,表明模型也提高了质量。这些材料的增加导致专利申请量增加了 39%,并且几个月后,产品原型中使用这些新化合物的比例增加了 17%。在考虑投入成本后,该工具将研发效率提高了 13-15%。这些结果有两个启示。首先,它们展示了 AI 增强型研究的潜力。其次,它们证实了这些发现能够转化为产品创新,而不会完全受制于研发的后期阶段。AI 加速了创新速度,但这些突破有多新颖?在科学中使用机器学习的一个关键问题是它可能加剧“路灯效应”(Khurana,2023;Kim,2023;Hoelzemann 等,2024)。由于模型基于现有知识进行训练,可能会将搜索引导至理解较充分但价值较低的领域。与此假设相反,我发现该工具在研发的所有三个阶段都增加了新颖性。我首先使用 De 等(2016)提出的化学相似性方法,衡量新材料本身的独创性。与现有化合物相比,模型生成的材料具有更独特的物理结构,这表明 AI 解锁了设计空间的新领域。其次,我显示这会带来更多的创新发明。由处理后的科学家提交的专利更可能引入新的技术术语——这是一项变革性技术的领先指标(Kalyani,2024)。第三,我发现 AI 改变了产品的性质:它增加了代表新产品线的原型的比例,而不是对现有产品的改进,促使创新更加激进(Acemoglu 等,2022a)。接下来,我研究该技术的分配效应,显示它对高能力科学家具有不成比例的好处。我基于处理前期的发现构建了一个初始生产力的衡量指标。为考虑某些化合物固有的发现难易程度,我控制了材料类型和应用。通过估计每个生产力分位的单独处理效果,我记录了在能力分布中的显著差异性影响。虽然底部三分之一的研究人员几乎没有收益,但排名前十分位的科学家产出增加了 81%。因此,90:10 的绩效差距增加了一倍多。这表明 AI 和人类专业知识在创新生产功能上是互补的。本文的第二部分研究这些结果背后的机制。结合对科学家活动的丰富文本数据,我使用大型语言模型将其分类为研究任务,发现 AI 显著改变了发现过程。该工具自动化了大多数“创意生成”任务,将科学家重新分配到评估模型推荐的候选化合物的任务中。没有 AI 时,研究人员将近一半的时间用于构思潜在材料;在工具引入后,这一比例下降到不到 16%。与此同时,评估候选材料的时间增加了 74%。因此,AI 有对立的影响:尽管在设计化合物的特定活动中替代了劳动,但在更广泛的发现过程中通过其与评估任务的互补性增强了劳动。接着,我显示科学家在判断 AI 生成的候选化合物方面的差异化能力解释了该工具的异质性影响。我收集了研究人员测试的材料数据及其实验结果。顶尖科学家利用他们的专业知识识别有前景的 AI 建议,使他们能够优先研究最可行的候选材料。相比之下,其他人则在测试错误结果上浪费了大量资源。确实,有一部分研究人员在测试排序上表现得和随机机会无异,几乎没有从工具中受益。评估能力与初始生产力呈正相关,解释了科学家绩效不平等的加剧。这些结果表明了一种新研究技能的重要性——评估模型预测——这种技能补充了 AI 技术。由此,我提供了 Agrawal 等(2018)的观点证据,即机器预测的改进使人类判断和决策更具价值。为了了解这些判断差异的来源,我对实验室研究人员进行了调查。调查结果揭示了领域知识的核心作用。擅长评估的科学家认为与类似材料的培训和经验是其评估过程的关键。而在判断 AI 推荐化合物方面有困难的研究人员表示,他们的背景帮助不大。支持这一解释,评估能力处于上四分位的研究人员发表过专注于其研究材料的学术文章的可能性高出 3.4 倍。尽管有人认为大数据和机器学习会使领域知识变得多余(Anderson,2008;Gennatas 等,2020),但这些结果显示只有具有足够专业知识的科学家才能利用 AI 的力量。我结合我的估计和一个简单的模型,来说明组织适应如何放大工具的影响。AI 改变了特定技能的回报,增加了判断能力的价值,同时降低了创意生成的重要性。因此,调整招聘实践以优先考虑具有强判断能力的科学家将带来显著的生产力提升。在样本的最后一个月(未纳入主要分析),实验室解雇了 3% 的研究人员。符合理论,83% 的被解雇科学家在判断能力上处于底部四分位。实验室通过增加招聘人数,净扩展了其员工队伍。由于这种研究人员构成的变化,我的估计可能低估了 AI 的长期影响。新技术的影响不仅限于生产力。它们可能深刻影响员工的幸福感和成功所需的专业知识(Nazareno 和 Schiff,2021;Soffia 等,2024)。在创新背景下,这些考虑尤为重要,因为它们调节了 AI 对谁成为科学家、他们进入的领域以及他们投资的技能的影响。本文的最后一部分使用调查探讨了这些问题。研究人员对工作内容的满意度下降了 44%。这一影响在科学家之间相当均匀,表明即使 AI 的“受益者”也面临成本。受访者将技能未充分利用和创造力降低列为其主要关切,突显了适应快速技术进步的难度。此外,这些结果质疑了 AI 将主要自动化繁琐任务,使人类专注于更有价值活动的观点。虽然改善生产力带来的乐趣部分抵消了这种负面影响,特别是对高能力科学家而言,但 82% 的研究人员整体上感到幸福感下降。除了影响工作满意度,使用该工具还改变了材料科学家对人工智能的看法。对 AI 能够提升生产力的信任几乎翻倍。同时,对失业的担忧保持不变,反映了对人类判断的持续需求。然而,由于研究过程的变化,科学家们预计 AI 将改变其领域内取得成功所需的技能。因此,计划重新培训的研究人员数量增加了 71%。这些发现表明,亲身体验 AI 可以显著影响对技术的看法。调查结果还揭示了一个重要事实:领域专家并未预料到本文记录的这些影响。尽管我的研究主要聚焦于材料科学,这些洞见可能更广泛地适用于需要在庞大但定义明确的技术空间中搜索的领域。这类领域的基础原理已知,但由于复杂性,很难识别具体实例。例如,在药物发现中,原子键的特性已被充分理解,但大量可能的化学配置使得问题极其复杂。深度学习模型在从复杂数据中提取特征方面表现出色,在这些环境下具有变革研究的潜力(Hassabis,2022)。除材料科学和制药外,还有若干经济上重要的领域也属于此类,包括结构生物学(Jumper 等,2021;Abramson 等,2024;Subramaniam,2024)、基因组学(Caudai 等,2021)、气候学(Kochkov 等,2024)以及数学的某些部分(Tao,2024;Trinh 等,2024)。