基于上述需求,谷歌研究者开发出了ML-fairness-gym 框架,可以帮助机器学习从业者将基于模拟的分析引入到其机器学习系统中。这个组件已在多个领域被证明,在分析那些难以进行封闭形式分析的动态系统上是有效的。 ML-fairness-gym 使用了 Open AI 的 Gym 框架来模拟序列决策。在该框架中,智能体以循环的方式与模拟环境交互。在每一步,智能体都选择一个能够随后影响到环境状态的动作。然后,该环境会显示出一个观察结果,智能体用它来指导接下来的动作。在该框架中,环境对系统和问题的动态性进行建模,而观察结果则作为数据输入给智能体,而其中智能体可以视为机器学习系统。在借贷案例中,银行充当的角色是智能体。它以从环境中进行观察,从而接收贷款申请人以及他们的信用评分和组成员的信息,并以接受贷款或拒绝贷款的二分决策来执行动作。然后,环境对申请人是否成功偿还贷款进行建模,并且据此来调整申请人的信用评分。ML-fairness-gym 可以通过模拟这些结果,从而来评估银行政策对于所有申请人的公平性的长期影响。