**2025 年 8 月 7 日,OpenAI 发布《GPT-5 System Card》(下称 Card)。这是一份 50+ 页的“白皮书”——既是模型能力的答卷,也是安全治理的蓝图。相比以往系统卡,GPT-5 在 架构形态、推理范式、安全框架 上都有质的跃迁,足以成为 AI 产品经理、技术决策者与政策观察者的必读材料
**
- 统一系统架构:GPT-5是一个整合了快速响应模型、深度推理模型和实时路由模型的统一系统,可根据对话类型、复杂度等自动选择最优模型,未来计划整合为单一模型。
- 安全训练革新:从传统的“硬拒绝”(直接拒绝风险请求)转向“安全完成”(在符合安全政策的前提下最大化有用性),大幅提升双用途场景(如生物、网络安全)的安全性和有用性。
- 关键能力提升:在减少幻觉( factual errors)、降低谄媚行为(sycophancy)、抵御越狱攻击(jailbreaks)、增强指令层级遵守能力等方面取得显著进步,尤其在健康、多语言处理等领域表现突出。
- 严格外部评估:通过超过400名外部测试者和专家的红队测试(累计超9000小时),在暴力攻击规划、提示注入等风险场景中验证了安全性,多个外部机构(如Microsoft AI Red Team、Pattern Labs)评估其安全性优于前代模型。
- 生物与网络安全防护:将GPT-5-thinking列为“高生物与化学风险”等级,实施多层防护措施(模型训练、系统级监控、账户级 enforcement、API访问控制等),并通过第三方红队和政府机构测试验证有效性。
![]()