This paper describes our participant system for the multi-modal fact verification (Factify) challenge at AAAI 2022. Despite the recent advance in text based verification techniques and large pre-trained multimodal models cross vision and language, very limited work has been done in applying multimodal techniques to automate fact checking process, particularly considering the increasing prevalence of claims and fake news about images and videos on social media. In our work, the challenge is treated as multimodal entailment task and framed as multi-class classification. Two baseline approaches are proposed and explored including an ensemble model (combining two uni-modal models) and a multi-modal attention network (modeling the interaction between image and text pair from claim and evidence document). We conduct several experiments investigating and benchmarking different SoTA pre-trained transformers and vision models in this work. Our best model is ranked first in leaderboard which obtains a weighted average F-measure of 0.77 on both validation and test set. Exploratory analysis of dataset is also carried out on the Factify data set and uncovers salient patterns and issues (e.g., word overlapping, visual entailment correlation, source bias) that motivates our hypothesis. Finally, we highlight challenges of the task and multimodal dataset for future research.


翻译:本文介绍了AAAI 2022年多式事实核查(Factify)挑战的参与者系统。尽管最近在基于文本的核查技术和经过预先培训的大型多式联运模型方面有所进步,而且具有不同的远见和语言,但在应用多式联运技术使事实检查过程自动化方面所做的工作非常有限,特别是考虑到权利主张的日益普遍,以及社交媒体图像和视频的假消息日益普遍,在我们的工作中,这一挑战被视为多式要求任务,并被设计成多级分类。提出和探索了两种基线方法,包括混合模型(合并两个单式模型)和多式关注网络(根据索赔和证据文件建模图像和文本对配的互动)。我们在这项工作中进行了几项实验,对不同的SoTA预先培训的变压器和愿景模型进行了基准调查和基准。我们的最佳模型排在领导板上排名第一,在验证和测试中均获得0.77的加权平均F度度。对数据集的探索性分析还在“Fitificificific”数据集中进行,并发现突出的模式和问题(例如词语重叠、视觉要求的关联、来源偏差)激励我们未来的数据假设。

0
下载
关闭预览

相关内容

【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
19+阅读 · 2021年12月21日
【CIKM2020】神经逻辑推理,Neural Logic Reasoning
专知会员服务
50+阅读 · 2020年8月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
disentangled-representation-papers
CreateAMind
26+阅读 · 2018年9月12日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
视频超分辨 Detail-revealing Deep Video Super-resolution 论文笔记
统计学习与视觉计算组
17+阅读 · 2018年3月16日
人工智能 | 国际会议/SCI期刊约稿信息9条
Call4Papers
3+阅读 · 2018年1月12日
gan生成图像at 1024² 的 代码 论文
CreateAMind
4+阅读 · 2017年10月31日
【学习】Hierarchical Softmax
机器学习研究会
4+阅读 · 2017年8月6日
A Survey on Automated Fact-Checking
Arxiv
8+阅读 · 2021年8月26日
Kernel Graph Attention Network for Fact Verification
Arxiv
3+阅读 · 2019年10月23日
Arxiv
11+阅读 · 2019年4月15日
Factor Graph Attention
Arxiv
6+阅读 · 2019年4月11日
Arxiv
11+阅读 · 2018年1月18日
VIP会员
相关VIP内容
【AAAI2022】通过多任务学习改进证据深度学习
专知会员服务
19+阅读 · 2021年12月21日
【CIKM2020】神经逻辑推理,Neural Logic Reasoning
专知会员服务
50+阅读 · 2020年8月25日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
相关资讯
Top
微信扫码咨询专知VIP会员