Crowdsourcing is a popular paradigm for soliciting forecasts on future events. As people may have different forecasts, how to aggregate solicited forecasts into a single accurate prediction remains to be an important challenge, especially when no historical accuracy information is available for identifying experts. In this paper, we borrow ideas from the peer prediction literature and assess the prediction accuracy of participants using solely the collected forecasts. This approach leverages the correlations among peer reports to cross-validate each participant's forecasts and allows us to assign a "peer assessment score (PAS)" for each agent as a proxy for the agent's prediction accuracy. We identify several empirically effective methods to generate PAS and propose an aggregation framework that uses PAS to identify experts and to boost existing aggregators' prediction accuracy. We evaluate our methods over 14 real-world datasets and show that i) PAS generated from peer prediction methods can approximately reflect the prediction accuracy of agents, and ii) our aggregation framework demonstrates consistent and significant improvement in the prediction accuracy over existing aggregators for both binary and multi-choice questions under three popular accuracy measures: Brier score (mean square error), log score (cross-entropy loss) and AUC-ROC.


翻译:由于人们可能有不同的预测,如何将索取的预测汇总成单一准确的预测仍是一项重大挑战,特别是当没有历史准确性信息可供鉴定专家时。在本文中,我们借用同行预测文献中的想法,并评估仅使用所收集的预测的参与者的预测准确性。这种方法利用同行报告之间的相互关系来交叉校验每个参与者的预测,并使我们能够为每个代理商指定一个“同行评估分数(PAS)”作为该代理商预测准确性的代理。我们确定了若干有效的实证方法,以生成考绩制度,并提议一个汇总框架,利用考绩制度确定专家,提高现有的聚合者的预测准确性。我们评估了14多个真实世界数据集的方法,并表明一)同行预测方法产生的考绩制度可以大致反映代理人的预测准确性,二)我们的汇总框架显示,在三种大众精确度措施下,对二分数和多选题的现有聚合器的预测准确性预测准确性都得到了一致和显著的改进:Brier评分(平均误差)、log-Cropy损失(CU)和Acrosty-CU。

0
下载
关闭预览

相关内容

机器学习系统设计系统评估标准
专知会员服务
85+阅读 · 2021年1月7日
图像分割方法综述
专知会员服务
54+阅读 · 2020年11月22日
ECCV 2020 五项大奖出炉!普林斯顿邓嘉获最佳论文奖
专知会员服务
13+阅读 · 2020年8月25日
因果图,Causal Graphs,52页ppt
专知会员服务
247+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
40+阅读 · 2019年10月9日
SIGIR2019 接收论文列表
专知
18+阅读 · 2019年4月20日
LibRec 精选:推荐的可解释性[综述]
LibRec智能推荐
10+阅读 · 2018年5月4日
LibRec 精选:推荐系统9个必备数据集
LibRec智能推荐
6+阅读 · 2018年3月7日
计算机视觉近一年进展综述
机器学习研究会
9+阅读 · 2017年11月25日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Arxiv
0+阅读 · 2021年4月28日
Inductive Relation Prediction by Subgraph Reasoning
Arxiv
11+阅读 · 2020年2月12日
Foreground-aware Image Inpainting
Arxiv
4+阅读 · 2019年1月17日
VIP会员
相关VIP内容
专知会员服务
85+阅读 · 2021年1月7日
图像分割方法综述
专知会员服务
54+阅读 · 2020年11月22日
ECCV 2020 五项大奖出炉!普林斯顿邓嘉获最佳论文奖
专知会员服务
13+阅读 · 2020年8月25日
因果图,Causal Graphs,52页ppt
专知会员服务
247+阅读 · 2020年4月19日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
92+阅读 · 2019年10月10日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
40+阅读 · 2019年10月9日
Top
微信扫码咨询专知VIP会员