Understanding collective decision making at a large-scale, and elucidating how community organization and community dynamics shape collective behavior are at the heart of social science research. In this work we study the behavior of thousands of communities with millions of active members. We define a novel task: predicting which community will undertake an unexpected, large-scale, distributed campaign. To this end, we develop a hybrid model, combining textual cues, community meta-data, and structural properties. We show how this multi-faceted model can accurately predict large-scale collective decision-making in a distributed environment. We demonstrate the applicability of our model through Reddit's r/place - a large-scale online experiment in which millions of users, self-organized in thousands of communities, clashed and collaborated in an effort to realize their agenda. Our hybrid model achieves a high F1 prediction score of 0.826. We find that coarse meta-features are as important for prediction accuracy as fine-grained textual cues, while explicit structural features play a smaller role. Interpreting our model, we provide and support various social insights about the unique characteristics of the communities that participated in the \r/place experiment. Our results and analysis shed light on the complex social dynamics that drive collective behavior, and on the factors that propel user coordination. The scale and the unique conditions of the \rp~experiment suggest that our findings may apply in broader contexts, such as online activism, (countering) the spread of hate speech and reducing political polarization. The broader applicability of the model is demonstrated through an extensive analysis of the WallStreetBets community, their role in r/place and four years later, in the GameStop short squeeze campaign of 2021.
翻译:大规模地理解集体决策,并阐明社区组织和社区动态如何影响集体行为,这是社会科学研究的核心。我们在此工作中研究数千个社区及数百万活跃成员的行为。我们定义了一项新颖的任务:预测哪个社区将开展意想不到的大规模分散运动。为此,我们开发了一个混合模型,将文字提示、社区元数据和结构属性结合起来。我们展示了这一多面模型如何准确预测分布环境中的大规模集体决策。我们通过Reddit的 r/place 展示了我们的模型的可适用性。我们展示了我们模型的可适用性,这是一个大规模在线实验,数百万用户在数千个社区中自行组织起来,相互冲突并合作,努力实现其议程。我们混合模型的F1预测得分高达0.826。我们发现,粗面的元性模型对于预测准确性与精细的文本缩略提示一样重要,而明确的结构性特征则发挥更小的作用。我们在解释我们的模型时,我们提供并支持各种社会洞察,关于更深层次的社区的独特特征的社交认识,在数千个社区内进行自我组织的自我组织的自我组织, 滚动分析,在20级的滚动分析中,我们所参与的滚动的滚动中,我们所展示了 的 的 的 的 的 的 的 的 和滚动分析中,在20 滚动 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 滚动性 的 的 的 的 的 的 滚动性 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的 的