COVID-19假冒新闻探测语言示范微调方法 (Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake News Detection) - 专知论文

会员服务 ·

0

语言模型化 · MoDELS · COVID-19 · Performer · state-of-the-art ·

2021 年 1 月 18 日

Transformer-based Language Model Fine-tuning Methods for COVID-19 Fake News Detection

翻译：COVID-19假冒新闻探测语言示范微调方法

Ben Chen,Bin Chen,Dehong Gao,Qijin Chen,Chengfu Huo,Xiaonan Meng,Weijun Ren,Yang Zhou

from arxiv, 9 pages, 1 figures

With the pandemic of COVID-19, relevant fake news is spreading all over the sky throughout the social media. Believing in them without discrimination can cause great trouble to people's life. However, universal language models may perform weakly in these fake news detection for lack of large-scale annotated data and sufficient semantic understanding of domain-specific knowledge. While the model trained on corresponding corpora is also mediocre for insufficient learning. In this paper, we propose a novel transformer-based language model fine-tuning approach for these fake news detection. First, the token vocabulary of individual model is expanded for the actual semantics of professional phrases. Second, we adapt the heated-up softmax loss to distinguish the hard-mining samples, which are common for fake news because of the disambiguation of short text. Then, we involve adversarial training to improve the model's robustness. Last, the predicted features extracted by universal language model RoBERTa and domain-specific model CT-BERT are fused by one multiple layer perception to integrate fine-grained and high-level specific representations. Quantitative experimental results evaluated on existing COVID-19 fake news dataset show its superior performances compared to the state-of-the-art methods among various evaluation metrics. Furthermore, the best weighted average F1 score achieves 99.02%.

翻译：随着COVID-19的流行,相关的假新闻正在社交媒体中到处传播。相信它们而不加歧视,可能会给人们的生活造成巨大麻烦。然而,由于缺少大规模附加数据和对特定领域知识的语义理解不足,通用语言模型在这些假新闻探测中的表现可能微弱。虽然关于相应的公司模式的训练也是平庸的,学习不够充分。在本文中,我们建议为这些假新闻探测采用一种新型的基于变压器的语言模型微调模型。首先,个人模型的象征性词汇为专业词句的实际语义表达方式而扩大。第二,我们调整高压软体损失,以区分硬体采矿样本,由于短文的模糊,这些样本对假新闻很常见。然后,我们进行对抗性培训,以提高模型的稳健性。最后,通过通用语言模型RoBERTA和特定域模型CT-BERT所提取的预测特征,由多层概念概念结合,将精细和高层次的具体表述方式结合起来。第二,我们调整了加热调的软体软体损失的样本,以辨别为假体标本新闻样本,因为短体的模型显示现有COVI1 标准标准评了各种标准评。

0

相关内容

语言模型化

语言模型化

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

323+阅读 · 2020年11月26日

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

专知会员服务

41+阅读 · 2020年7月14日

【深度学习社区检测】Deep Learning for Community Detection: Progress, Challenges and Opportunities

【深度学习社区检测】Deep Learning for Community Detection: Progress, Challenges and Opportunities

专知会员服务

28+阅读 · 2020年6月13日

【视频描述综述论文】Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

【视频描述综述论文】Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

专知会员服务

65+阅读 · 2020年5月12日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

2019年自然语言处理NLP亮点总结，29页pdf，NLP Year in Review — 2019 NLP highlights for the year 2019.

2019年自然语言处理NLP亮点总结，29页pdf，NLP Year in Review — 2019 NLP highlights for the year 2019.

专知会员服务

69+阅读 · 2020年1月2日

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

专知会员服务

43+阅读 · 2019年12月6日

清华大学张敏老师，个性化推荐的基础与趋势，145页ppt

清华大学张敏老师，个性化推荐的基础与趋势，145页ppt

专知会员服务

87+阅读 · 2019年11月27日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

专知

10+阅读 · 2019年9月3日

无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019

无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019

PaperWeekly

7+阅读 · 2019年5月5日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

清华大学NLP组整理的机器翻译论文阅读清单

清华大学NLP组整理的机器翻译论文阅读清单

AINLP

5+阅读 · 2018年12月29日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

已删除

将门创投

5+阅读 · 2018年2月28日

计算机视觉近一年进展综述

计算机视觉近一年进展综述

机器学习研究会

9+阅读 · 2017年11月25日

【今日新增】计算机领域国际会议截稿信息

【今日新增】计算机领域国际会议截稿信息

Call4Papers

9+阅读 · 2017年7月21日

Vision Transformer for COVID-19 CXR Diagnosis using Chest X-ray Feature Corpus

Arxiv

1+阅读 · 2021年3月12日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Mining Dual Emotion for Fake News Detection

Arxiv

13+阅读 · 2020年10月19日

Leveraging Declarative Knowledge in Text and First-Order Logic for Fine-Grained Propaganda Detection

Arxiv

4+阅读 · 2020年4月29日

Fine-tuning BERT for Joint Entity and Relation Extraction in Chinese Medical Text

Fine-tuning BERT for Joint Entity and Relation Extraction in Chinese Medical Text

Arxiv

6+阅读 · 2019年8月21日

Weakly Supervised Object Detection in Artworks

Arxiv

4+阅读 · 2018年10月5日

One-Class Adversarial Nets for Fraud Detection

Arxiv

3+阅读 · 2018年6月5日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering

Arxiv

6+阅读 · 2018年1月30日

Fake Colorized Image Detection

Arxiv

6+阅读 · 2018年1月14日

VIP会员

文章信息

相关主题

语言模型化

state-of-the-art

相关VIP内容

最新《Transformers模型》教程，64页ppt

最新《Transformers模型》教程，64页ppt

专知会员服务

323+阅读 · 2020年11月26日

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

【论文】持续学习的图神经网络用于检测社交媒体的假新闻，Graph Neural Networks with Continual Learning for Fake News Detection from Social Media

专知会员服务

41+阅读 · 2020年7月14日

【深度学习社区检测】Deep Learning for Community Detection: Progress, Challenges and Opportunities

【深度学习社区检测】Deep Learning for Community Detection: Progress, Challenges and Opportunities

专知会员服务

28+阅读 · 2020年6月13日

【视频描述综述论文】Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

【视频描述综述论文】Video Description: A Survey of Methods, Datasets, and Evaluation Metrics

专知会员服务

65+阅读 · 2020年5月12日

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

图像分类技巧集，17页ppt《Bag of Tricks for Image Classification》

专知会员服务

96+阅读 · 2020年3月12日

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

【东大-UCSB】虚假新闻检测的自然语言处理研究综述，A Survey on Natural Language Processing for Fake News Detection

专知会员服务

79+阅读 · 2020年2月12日

2019年自然语言处理NLP亮点总结，29页pdf，NLP Year in Review — 2019 NLP highlights for the year 2019.

2019年自然语言处理NLP亮点总结，29页pdf，NLP Year in Review — 2019 NLP highlights for the year 2019.

专知会员服务

69+阅读 · 2020年1月2日

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

【KDD2019|讲座推荐】虚假新闻研究：理论、发现策略与开放性问题：Fake News Research: Theories, Detection Strategies, and Open Problems

专知会员服务

43+阅读 · 2019年12月6日

清华大学张敏老师，个性化推荐的基础与趋势，145页ppt

清华大学张敏老师，个性化推荐的基础与趋势，145页ppt

专知会员服务

87+阅读 · 2019年11月27日

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

Auto-Sizing the Transformer Network: Improving Speed, Efficiency, and Performance for Low-Resource Machine Translation

专知会员服务

49+阅读 · 2019年10月17日

热门VIP内容

开通专知VIP会员享更多权益服务

【CMU博士论文】用于提升含优化层学习的算法与体系结构

【NeurIPS2025】有何不同于过去？基于自监督偏差学习的时空时间序列预测

超越决策优势：情报在创新与适应中的作用

量子计算发展态势研究报告（2025年）

相关资讯

RoBERTa中文预训练模型：RoBERTa for Chinese

RoBERTa中文预训练模型：RoBERTa for Chinese

PaperWeekly

57+阅读 · 2019年9月16日

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

RoBERTa for Chinese：大规模中文预训练RoBERTa模型

AINLP

30+阅读 · 2019年9月8日

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

【VLDB2019】虚假新闻（Fake News）检测全面综述教程，156页PPT带你进入这一领域

专知

10+阅读 · 2019年9月3日

无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019

无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019

PaperWeekly

7+阅读 · 2019年5月5日

Unsupervised Learning via Meta-Learning

Unsupervised Learning via Meta-Learning

CreateAMind

43+阅读 · 2019年1月3日

清华大学NLP组整理的机器翻译论文阅读清单

清华大学NLP组整理的机器翻译论文阅读清单

AINLP

5+阅读 · 2018年12月29日

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

谷歌发表的史上最强NLP模型BERT的官方代码和预训练模型可以下载了

AINLP

12+阅读 · 2018年11月1日

已删除

将门创投

5+阅读 · 2018年2月28日

计算机视觉近一年进展综述

计算机视觉近一年进展综述

机器学习研究会

9+阅读 · 2017年11月25日

【今日新增】计算机领域国际会议截稿信息

【今日新增】计算机领域国际会议截稿信息

Call4Papers

9+阅读 · 2017年7月21日

相关论文

Vision Transformer for COVID-19 CXR Diagnosis using Chest X-ray Feature Corpus

Arxiv

1+阅读 · 2021年3月12日

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

UP-DETR: Unsupervised Pre-training for Object Detection with Transformers

Arxiv

19+阅读 · 2020年11月18日

Mining Dual Emotion for Fake News Detection

Arxiv

13+阅读 · 2020年10月19日

Leveraging Declarative Knowledge in Text and First-Order Logic for Fine-Grained Propaganda Detection

Arxiv

4+阅读 · 2020年4月29日

Fine-tuning BERT for Joint Entity and Relation Extraction in Chinese Medical Text

Fine-tuning BERT for Joint Entity and Relation Extraction in Chinese Medical Text

Arxiv

6+阅读 · 2019年8月21日

Weakly Supervised Object Detection in Artworks

Arxiv

4+阅读 · 2018年10月5日

One-Class Adversarial Nets for Fraud Detection

Arxiv

3+阅读 · 2018年6月5日

Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations

Arxiv

4+阅读 · 2018年5月18日

An Attention-Based Word-Level Interaction Model: Relation Detection for Knowledge Base Question Answering

Arxiv

6+阅读 · 2018年1月30日

Fake Colorized Image Detection

Arxiv

6+阅读 · 2018年1月14日

微信扫码咨询专知VIP会员