人工智能(AI)智能体正在并将继续成为我们周围世界中不可或缺的关键参与者。我们希望智能体能使我们的生活变得更好、更容易、更安全、更有趣、更有价值。但很明显,智能体并不总是以我们期望的和我们希望的方式行事。有时,这是因为它们的设计中存在错误的规定或缺陷,有时则是因为它们在建造时考虑到了恶意的目标。这篇论文表明,通过仔细思考智能体的世界模型和激励机制,我们可以设计出性能更强、对对抗性攻击更强大的多智能体系统。
其中一项研究考虑了在有买票人的情况下选举系统的设计--买票人是一个试图付钱给选民让他们以某种方式投票,从而改变选举结果的实体。假设选票购买者的预算有限,并试图从有可能改变选举结果的选民亚群中购买选票,这项研究显示了运行和管理选举的选举当局如何通过分发诱饵选票并利用这些选票来消耗选票购买者的预算来保护选举的完整性。
介绍了两个新的多智能体学习框架。第一个框架包括对Arcade学习环境和OpenAI Gym的一系列修改,允许训练和部署多个智能体,以及通过写入模拟器RAM任意修改环境。第二个是一个新的环境(Javatari学习环境),用于将人工智能体与人类一起部署。利用这些新的框架,这项工作研究了可以与人类或低技能智能体在同一世界中合作行动的辅助代理的设计。