Online Public Opinion Reports consolidate news and social media for timely crisis management by governments and enterprises. While large language models have made automated report generation technically feasible, systematic research in this specific area remains notably absent, particularly lacking formal task definitions and corresponding benchmarks. To bridge this gap, we define the Automated Online Public Opinion Report Generation (OPOR-GEN) task and construct OPOR-BENCH, an event-centric dataset covering 463 crisis events with their corresponding news articles, social media posts, and a reference summary. To evaluate report quality, we propose OPOR-EVAL, a novel agent-based framework that simulates human expert evaluation by analyzing generated reports in context. Experiments with frontier models demonstrate that our framework achieves high correlation with human judgments. Our comprehensive task definition, benchmark dataset, and evaluation framework provide a solid foundation for future research in this critical domain.


翻译:在线舆情报告整合新闻和社交媒体信息,为政府和企业提供及时的危机管理支持。尽管大语言模型已使自动化报告生成在技术上成为可能,但该特定领域的系统性研究仍显著缺失,尤其缺乏正式的任务定义和相应的基准。为填补这一空白,我们定义了自动化在线舆情报告生成任务,并构建了OPOR-BENCH——一个以事件为中心的数据集,涵盖463个危机事件及其对应的新闻文章、社交媒体帖子和参考摘要。为评估报告质量,我们提出了OPOR-EVAL,一种基于智能体的新型评估框架,通过上下文分析生成报告来模拟人类专家评估。对前沿模型的实验表明,该框架与人工评估结果具有高度相关性。我们全面的任务定义、基准数据集和评估框架为这一关键领域的未来研究奠定了坚实基础。

0
下载
关闭预览

相关内容

【CVPR2023】DynamicDet:目标检测的统一动态架构
专知会员服务
26+阅读 · 2023年4月15日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2014年12月31日
国家自然科学基金
8+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员