【博士论文】迈向负责任的人工智能：自主系统在安全性、公平性与可问责性方面的最新进展

随着自主系统日益渗透到关键社会领域，确保人工智能（AI）的负责任使用已成为当务之急。然而，“可信AI”这一概念依然广泛且多维。本论文在AI系统的安全性、公平性、透明性与可问责性方面推进了相关研究。在安全性方面，我们扩展了经典的确定性屏蔽技术，使其具备对延迟观测的鲁棒性，从而支持在现实世界条件下的实际部署。同时，我们将确定性与概率性安全屏蔽机制应用于仿真自动驾驶车辆，以防止与道路使用者发生碰撞，并在逼真的驾驶模拟环境中验证了这些技术的有效性。在公平性方面，我们提出了“公平性屏蔽”（fairness shields）这一新颖的后处理方法，用于在有限或周期性时间范围内的序贯决策场景中强制实现群体公平。该方法在严格满足公平性约束的前提下，优化干预成本，实现在最小干预下的公平性保障。针对透明性与可问责性，我们提出了一个评估概率性决策智能体意图行为的形式化框架，并引入了智能体性指标（agency）与意图商（intention quotient）等定量度量。我们利用这些指标设计了用于事后分析意图的方法，有助于在自主系统造成非预期伤害时厘清其责任归属。最后，我们通过“反应式决策”（reactive decision-making）框架将上述贡献统一起来，提出了一种能够整合现有方法的通用形式化建模方式。总体而言，本论文所提出的多项进展在实现更安全、公平、可问责的AI系统方面具有现实意义，也为可信AI的后续研究奠定了基础。

成为VIP会员查看完整内容

相关内容

博士论文

关注 116

博士论文是由攻读博士学位的研究生所撰写的学术论文。它要求作者在博士生导师的指导下，选择自己能够把握和驾驭的潜在的研究方向，开辟新的研究领域。由此可见，这就对作者提出了较高要求，它要求作者必须在本学科的专业领域具备大量的理论知识，并对所学专业的理论知识有相当深入的理解和思考，同时还要具有相当水平的独立科学研究能力，能够为在学科领域提出独创性的见解和有价值的科研成果。因而，较之学士论文、硕士论文，博士论文具有更高的学术价值，对学科的发展具有重要的推动作用。

【伯克利博士论文】机器学习中的安全性、鲁棒性与可解释性

专知会员服务

13+阅读 · 5月31日

【CMU博士论文】评估算法系统的隐私性与问责性

专知会员服务

9+阅读 · 5月27日

【EPFL博士论文】决策系统中的机器学习：公平性、鲁棒性与数据偏差

专知会员服务

23+阅读 · 5月19日

【CMU博士论文】重新思考面向风险感知的社会型具身智能的安全保障体系

专知会员服务

13+阅读 · 5月9日