Information that is of relevance for decision-making is often distributed, and held by self-interested agents. Decision markets are well-suited mechanisms to elicit such information and aggregate it into conditional forecasts that can be used for decision-making. However, for incentive-compatible elicitation, decision markets rely on stochastic decision rules which entails that sometimes actions have to be taken that have been predicted to be sub-optimal. In this work, we propose three closely related mechanisms that elicit and aggregate information similar to a decision market, but are incentive compatible despite using a deterministic decision rule. Following ideas from peer prediction mechanisms, proxies rather than observed future outcomes are used to score predictions. The first mechanism requires the principal to have her own signal, which is then used as a proxy to elicit information from a group of self-interested agents. The principal then deterministically maps the aggregated forecasts and the proxy to the best possible decision. The second and third mechanisms expand the first to cover a scenario where the principal does not have access to her own signal. The principal offers a partial profit to align the interest of one agent and retrieve its signal as a proxy; or alternatively uses a proper peer prediction mechanism to elicit signals from two agents. Aggregation and decision-making then follow the first mechanism. We evaluate our first mechanism using a multi-agent bandit learning system. The result suggests that the mechanism can train agents to achieve a performance similar to a Bayesian inference model with access to all information held by the agents.


翻译:信息的相关性通常是分散并由自私的代理持有。通过决策市场,可以搜集这些信息并合并它们成有条件的预报,从而适用于决策。但是,激励兼容性采集基于随机决策规则,这意味着有时必须采取预测的次优行动。本文提出了三种增加纠错性规则的机制,类似于决策市场会收集并合并信息,但采用确定性决策规则。与对等评估机制的思想一样,代理机制使用代理来评分,而不是观察到的未来结果。第一种机制需要委托者拥有自己的信号,然后将其用作代理人从一组自私的代理人那里收集信息。委托者然后按最佳可能决策μ运作聚合的预测& 代理人和代理。第二种和第三种机制扩展了第一种机制,以涵盖委托人无权访问自身信号的情况。委托者为该代理人提供部分利润,以促进该代理人的利益一致性,从而检索其信号作为代理;或使用适当的同行评估机制从两个代理人那里收集信号。然后进行汇总和决策,随后采用第一种机制。我们使用多代理大型计算机学习系统评估了我们的第一种机制。结果表明,该机制可以训练代理以实现与具有代理所持有的所有信息的贝叶斯推理模型类似的性能。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
【2023博士论文】《游戏和强化学习》北卡州立大学
专知会员服务
97+阅读 · 2023年1月27日
【伯克利Lydia Liu博士论文】机器学习与决策的社会动力学
【MIT】硬负样本的对比学习
专知会员服务
39+阅读 · 2020年10月14日
【KDD2020】TAdaNet: 用于图增强元学习的任务自适应网络
专知会员服务
17+阅读 · 2020年9月21日
让AI做决策,我们的社会准备好了吗?
学术头条
0+阅读 · 2022年6月6日
【新书】分布式强化学习,280页pdf
专知
21+阅读 · 2021年12月19日
LASSO回归与XGBoost:融合模型预测房价
论智
32+阅读 · 2018年8月8日
使用随机森林分类器预测森林火灾规模
论智
13+阅读 · 2018年5月15日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Arxiv
0+阅读 · 2023年5月6日
Arxiv
15+阅读 · 2021年12月22日
VIP会员
相关基金
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
Top
微信扫码咨询专知VIP会员