Current news datasets merely focus on text features on the news and rarely leverage the feature of images, excluding numerous essential features for news classification. In this paper, we propose a new dataset, N15News, which is generated from New York Times with 15 categories and contains both text and image information in each news. We design a novel multitask multimodal network with different fusion methods, and experiments show multimodal news classification performs better than text-only news classification. Depending on the length of the text, the classification accuracy can be increased by up to 5.8%. Our research reveals the relationship between the performance of a multimodal classifier and its sub-classifiers, and also the possible improvements when applying multimodal in news classification. N15News is shown to have great potential to prompt the multimodal news studies.


翻译:目前的新闻数据集仅仅侧重于新闻的文字特征,很少利用图像的特征,不包括许多重要的信息分类特征。在本文中,我们提议一个新的数据集N15News,该数据集来自《纽约时报》,分为15个类别,每个新闻都包含文字和图像信息。我们设计了一个新颖的多任务多式联运网络,采用不同的聚合方法,实验显示多式联运新闻分类的表现优于只使用文字的新闻分类。根据文本的长度,分类精确度可以提高到5.8%。我们的研究揭示了多式联运分类师及其子分类师的绩效之间的关系,以及在新闻分类中应用多式联运时可能作出的改进。N15News显示极有可能推动多式联运新闻研究。

0
下载
关闭预览

相关内容

专知会员服务
89+阅读 · 2021年6月17日
【Manning新书】现代Java实战,592页pdf
专知会员服务
101+阅读 · 2020年5月22日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
已删除
将门创投
11+阅读 · 2019年8月13日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Arxiv
0+阅读 · 2022年1月21日
Credibility-based Fake News Detection
Arxiv
3+阅读 · 2019年11月2日
How to Fine-Tune BERT for Text Classification?
Arxiv
13+阅读 · 2019年5月14日
Arxiv
12+阅读 · 2018年9月15日
Arxiv
5+阅读 · 2018年1月18日
Arxiv
3+阅读 · 2017年9月14日
VIP会员
相关资讯
【论文笔记】通俗理解少样本文本分类 (Few-Shot Text Classification) (1)
深度学习自然语言处理
7+阅读 · 2020年4月8日
已删除
将门创投
11+阅读 · 2019年8月13日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Top
微信扫码咨询专知VIP会员