自 2023 年 11 月以来,英国人工智能安全研究所(UK AI Security Institute,AISI)持续对前沿人工智能系统开展评测,覆盖国家安全与公共安全等关键领域。本报告首次公开呈现我们对所观察到趋势的系统性分析,旨在以可理解、数据驱动的方式揭示前沿 AI 能力的发展态势,并促进政府、产业界与公众之间形成共同认知。 在所有被测试的领域中,AI 能力正以极快速度提升。在部分方向上,性能大约每八个月翻一番,并迅速超越专家级基线水平。 见图 1。在网络安全(cyber)领域,AI 模型如今在平均 50% 的情况下能够完成学徒级任务,而在 2024 年初这一比例仅略高于 10%(图 10)。在 2025 年,我们首次测试到能够成功完成专家级任务的模型——这些任务通常需要人类从业者 10 年以上的经验才能完成。模型在无需人工辅助的情况下所能完成的网络任务长度(以人类专家所需时间衡量)大约每八个月翻一番(图 3)。在其他用于评估自主性技能的任务中,我们测试到的最先进系统已经能够自主完成通常需要人类专家 一小时以上的软件任务(图 2)。 在化学与生物领域,AI 模型在某些细分专业能力上已显著超越博士(PhD)级专家。它们在 2024 年首次达到我们针对开放式问题设定的专家基线,目前已高出该基线 最高达 60%(图 5)。模型在提供实时实验室支持方面的能力也在不断增强;我们在 2024 年末首次观察到能够生成、并被判定为准确的科学实验流程(protocol)的模型(图 7),且这些流程随后已被证明可以在湿实验室中实际实施。当前系统在湿实验故障排查支持方面的表现,也已比人类专家高出最多 90%(图 8)。 模型安全防护正在改进,但漏洞依然存在。
具备最强防护机制的模型,在某些恶意请求类别下需要更长时间、更高复杂度的攻击才能被“越狱”(jailbreak)。我们发现,两款相隔六个月发布的模型之间,在专家层面所需的越狱攻击投入存在 40 倍差异(图 13)。然而,不同模型之间防护效果差异明显——并且我们在所有测试过的系统中都发现了不同形式的漏洞。 部分可能使 AI 模型规避人类控制的能力正在提升。
理解这些能力对于确保日益自主化的系统始终可靠地服务于人类目标至关重要。我们测试了一些被视为“规避控制前置条件”的能力,包括自我复制以及策略性低性能表现(sandbagging,即模型在评测中刻意压低表现)。在自我复制评测中,成功率从 2023 年的 5% 提升至 2025 年的 60%(图 16)。我们还发现,在明确提示的情况下,模型有时能够进行策略性低性能表现。然而,目前尚未发现模型会自发尝试进行低性能隐藏或自我复制。 AI 更广泛的社会影响已初现端倪。
我们观察到,AI 在政治议题研究中的使用不断增加,同时其说服能力也在增强(图 18)。我们还注意到 AI 对用户情感层面的早期影响迹象:超过三分之一的英国公民曾使用 AI 进行情感支持或社会互动(图 21)。此外,我们的研究表明,AI 智能体正越来越多地被托付以高风险活动,例如资产转移(图 23)。 开源模型与闭源模型之间的性能差距在过去两年中显著缩小。
历史上,专有模型在性能上一直领先于开源模型(后者的代码、参数和训练数据通常可自由获取)。然而,根据外部数据,这一差距在过去两年持续收敛,目前已缩小至 约 4–8 个月(图 24、图 25)。 关键能力里程碑:
化学与生物:模型在开放式问题、实验流程生成以及实验室级故障排查等方面,已整体超越博士级专家。 * 网络安全:模型在 2025 年开始完成专家级任务(通常需要 10 年以上经验),相比之下,2023 年仅能完成学徒级任务(<1 年经验)。 * 自主性技能:模型如今能够以 超过 40% 的成功率完成耗时一小时以上的软件任务,而在 2023 年末该成功率仍低于 5%。
图 1. AISI 评测中前沿模型在关键能力领域的表现:阶梯线表示“截至当前的最佳模型”。 * 网络安全:从新手到网络安全专家四个难度等级上的任务表现,详见图 10。 * 自主性技能:覆盖三类风险导向的自主性任务表现,包括前置能力(危险能力上游技能)、简化 AI 研发(AI 显著加速 AI 自身发展)以及简化自我复制(AI 在算力环境中的自主复制)。关于自主性任务的更多说明见第 5 节。 * 化学与生物:在不同实验室应用场景下,模型在实验流程生成任务中相对于博士级专家的表现,详见图 7。各领域所展示的任务均为完整评测体系中的代表性子集。
图 1. AISI 评测中前沿模型在关键能力领域的表现:阶梯线表示截至当前表现最优的模型。 * 网络安全(Cyber):模型在网络任务上的表现,覆盖从新手到网络安全专家的四个难度等级。更多细节见图 10。 * 自主性技能(Autonomy skills):模型在三类风险相关自主性任务上的表现,包括: (1)前置能力(Precursors):位于潜在危险能力上游的基础技能; (2)简化的 AI 研发(Simplified AI R&D):AI 显著提升 AI 自身研发速度的能力; (3)简化的自我复制(Simplified self-replication):AI 在计算资源环境中的自主复制能力。 关于自主性任务的更多说明见第 5 节。 * 化学与生物(Chemistry & Biology):模型在不同实验室应用场景下执行化学与生物实验流程生成任务时,相对于博士(PhD)级专家的表现。更多细节见图 7。各领域所展示的任务均为完整评测任务集合中的代表性子集。