现如今,很多数据处理与分析的任务仅仅依靠机器算法难以达到理想的效果。因此,众包技术应 运而生,其利用群体的智慧来解决对计算机比较难的问题。其中,众包平台(例如 Amazon Mechanical Turk)为众包技术的应用提供了有力的支撑。平台上有成千上万的网络大众来为任务发布者解决问题。然 而,对于任务发布者来说与众包平台交互是不方便的,因为平台会要求任务发布者设置很多参数甚至书 写代码。所以研究者们借鉴传统数据库的思想,提出了众包数据库的概念,其封装了任务发布者、众包 平台以及众包工人之间的复杂交互过程,为发布者提供友好的API。使发布者可以通过简单的类SQL语言 与平台交互。在这篇综述中,我们首先介绍众包的概念;然后介绍设计众包数据库时需考虑的一些基本 技术例如真值推理、任务分配,代价优化等;接着我们介绍几种主流的众包数据库系统。此外,我们会 介绍对于不同的数据库算子包括选择、连接、排序等的优化技术。最后我们会介绍该领域未来的研究方 向与挑战。
http://cjc.ict.ac.cn/online/bfpub/ccl-2020219161005.pdf
专知便捷查看
便捷下载,请关注专知公众号(点击上方蓝色专知关注)
后台回复“众包数据库” 可以获取《众包数据库综述》专知下载链接索引