A key challenge in crowdsourcing is that majority may make systematic mistakes (e.g. in the classic bat and ball problem: A bat and ball cost \$1.10. The bat costs \$1 more than the ball. How much does the ball cost?, the majority may answer \$.10). Prior work focuses on eliciting the best answer without prior even when the majority is wrong. Here we focus on eliciting the full thinking hierarchy without any prior. By asking a single open response question and eliciting both of each respondent's answer (e.g. \$.05) and guess(es) for other people's answers (e.g. \$.10), we construct an answer-guess matrix that records the number of people who report a specific answer-guess pair (e.g. 10 people answer \$.05 and guess \$.10). By ranking the answers to maximize the sum of the upper triangular area of the matrix, we obtain and visualize the hierarchy of the answers without any prior (e.g. we obtain "\$.05->\$.5->\$.10" hierarchy for bat and ball in our study). Our paradigm is highly practical since unlike prior work, the respondent does not need to perform multiple tasks nor report a distribution. Moreover, the requester does not need prior knowledge to design possible options for respondents. Our empirical studies not only demonstrate the superiority of our approach compared to plurality vote, but also show that more sophisticated people can reason about less sophisticated people's mind and the hierarchy can be approximately described by a directed acyclic graph.
翻译:众包中的一个关键挑战是,多数人可能会犯系统性错误(例如,典型的蝙蝠和球问题:蝙蝠和球的成本为$1.10。蝙蝠的成本比球高出1美元。球的成本是多少?球的成本是多少?,多数人可以回答$10。10 ) 。 先前的工作重点是在不事先甚至多数人错误的情况下找出最佳的答案。 我们这里的重点是在不事先任何之前获得全面思维等级。 通过提出单一的公开回答问题,并征求每个答复者的答复(例如:$.05)和猜测其他人的答案(例如:蝙蝠和球的成本是1.10美元),我们构建一个回答的词汇矩阵,记录报告具体答案对对口的人数(例如,10人回答$.05和猜测$10)。 我们这里的焦点是,通过排列答案,以尽量扩大矩阵的总数,我们获得答案的等级,而不用任何以前(例如,我们得到“关于精细的5-美元”的答案的猜测(例如,10美元)。 我们的答案矩阵矩阵矩阵的等级表表, 而不是我们之前的比较的等级,要显示我们研究的比较高级的等级, 之前的比较平分数的比较,我们的任务需要比前的比较的比较的比较的比较的比较的等级,我们的研究, 的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的等级,我们的研究,我们的任务需要的等级,我们的研究需要的比较的比较的比较的比较的比较的比较的比较的比较的比较的等级, 的比较的比较的比较的比较的等级, 的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的等级的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较的比较