在不确定的情况下做出决策,往往要权衡现有选择方案的预期成本和收益。成本与收益的权衡会使决策变得容易或困难,尤其是在成本与收益不确定的情况下。在这项研究中,我们评估了基于实例学习理论(IBLT)的认知模型和两种著名的强化学习(RL)算法如何在不确定和决策复杂度不断增加的情况下,学会在寻求目标的网格世界任务中做出更好的选择。我们还使用随机代理作为基础比较。我们的结果表明,IBL 模型和 RL 模型在简单设置下的准确度相当,尽管 RL 模型比 IBL 模型更有效。然而,随着决策复杂度的增加,IBL 模型不仅比 RL 模型更准确,而且更高效。我们的结果表明,即使成本增加,IBL 模型也能追求高回报的目标;而 RL 模型似乎会被较低的成本 "分散注意力",从而达到较低回报的目标。