The emergence of crowdsourced data has significantly reshaped social science, enabling extensive exploration of collective human actions, viewpoints, and societal dynamics. However, ensuring safe, fair, and reliable participation remains a persistent challenge. Traditional polling methods have seen a notable decline in engagement over recent decades, raising concerns about the credibility of collected data. Meanwhile, social and peer-to-peer networks have become increasingly widespread, but data from these platforms can suffer from credibility issues due to fraudulent or ineligible participation. In this paper, we explore how social interactions can help restore credibility in crowdsourced data collected over social networks. We present an empirical study to detect ineligible participation in a polling task through AI-based graph analysis of social interactions among imperfect participants composed of honest and dishonest actors. Our approach focuses solely on the structure of social interaction graphs, without relying on the content being shared. We simulate different levels and types of dishonest behavior among participants who attempt to propagate the task within their social networks. We conduct experiments on real-world social network datasets, using different eligibility criteria and modeling diverse participation patterns. Although structural differences in social interaction graphs introduce some performance variability, our study achieves promising results in detecting ineligibility across diverse social and behavioral profiles, with accuracy exceeding 90% in some configurations.


翻译:众包数据的兴起深刻重塑了社会科学领域,为系统性探索人类集体行为、观点与社会动态提供了广阔空间。然而,确保安全、公平且可靠的参与始终是持续存在的挑战。近几十年来,传统调查方法的参与度显著下降,引发了对所采集数据可信度的普遍担忧。与此同时,社交网络与点对点网络日益普及,但这些平台的数据常因欺诈性或不符合资格的参与而面临可信度问题。本文探讨如何通过社交互动机制提升社交网络众包数据的可信度。我们通过基于人工智能的图结构分析方法,对由诚实与不诚实参与者构成的非完美参与群体进行社交互动图谱分析,从而实现对调查任务中无效参与的检测。该方法仅关注社交互动图谱的结构特征,不依赖于所传播的内容本身。我们模拟了参与者在其社交网络中传播任务时不同程度与类型的不诚实行为,并在真实社交网络数据集上开展实验,采用不同的资格判定标准并建模多样化的参与模式。尽管社交互动图谱的结构差异会引入一定的性能波动,但本研究在检测不同社交行为特征群体的无效参与方面取得了显著成果,部分实验配置下的检测准确率超过90%。

0
下载
关闭预览

相关内容

FPGA加速深度学习综述
专知会员服务
72+阅读 · 2021年11月13日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员