Advances in AI generative models facilitate super-realistic video synthesis, amplifying misinformation risks via social media and eroding trust in digital content. Several research works have explored new deepfake detection methods on AI-generated images to alleviate these risks. However, with the fast development of video generation models, such as Sora and WanX, there is currently a lack of large-scale, high-quality AI-generated video datasets for forgery detection. In addition, existing detection approaches predominantly treat the task as binary classification, lacking explainability in model decision-making and failing to provide actionable insights or guidance for the public. To address these challenges, we propose \textbf{GenBuster-200K}, a large-scale AI-generated video dataset featuring 200K high-resolution video clips, diverse latest generative techniques, emphasis on fairness, and focus on real-world scenes. We further introduce \textbf{BusterX}, a novel AI-generated video detection and explanation framework leveraging multimodal large language model (MLLM) and reinforcement learning (RL) to provide authenticity determination and explainable rationales. To our knowledge, BusterX is the first framework to integrate MLLM with RL for explainable AI-generated video detection. Extensive experiments with state-of-the-art methods and ablation studies demonstrate the effectiveness and generalizability of BusterX.


翻译:人工智能生成模型的进步推动了超逼真视频合成技术的发展,通过社交媒体加剧了虚假信息传播风险,并削弱了公众对数字内容的信任。为缓解此类风险,已有若干研究工作探索了针对AI生成图像的新型深度伪造检测方法。然而,随着Sora、WanX等视频生成模型的快速发展,目前仍缺乏面向伪造检测的大规模、高质量AI生成视频数据集。此外,现有检测方法主要将任务视为二分类问题,缺乏模型决策的可解释性,难以为公众提供可操作的见解或指导。为应对这些挑战,我们提出了\\textbf{GenBuster-200K}——一个包含20万条高分辨率视频片段的大规模AI生成视频数据集,其特点涵盖多样化的最新生成技术、对公平性的强调以及对真实世界场景的关注。我们进一步提出了\\textbf{BusterX},一种创新的AI生成视频检测与解释框架,该框架利用多模态大语言模型(MLLM)和强化学习(RL)来提供真实性判定与可解释的决策依据。据我们所知,BusterX是首个将MLLM与RL相结合以实现可解释AI生成视频检测的框架。通过与前沿方法的广泛对比实验及消融研究,验证了BusterX的有效性与泛化能力。

0
下载
关闭预览

相关内容

【ACMMM2025】EvoVLMA: 进化式视觉-语言模型自适应
专知会员服务
15+阅读 · 8月5日
CVPR 2019 | 无监督领域特定单图像去模糊
PaperWeekly
14+阅读 · 2019年3月20日
Polygon-RNN++图像分割数据集自动标注
论智
10+阅读 · 2018年8月16日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
VIP会员
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
Top
微信扫码咨询专知VIP会员