Automatic humor detection has interesting use cases in modern technologies, such as chatbots and virtual assistants. Based on the general linguistic structure of humor, in this paper, we propose a novel approach for detecting humor in short texts by using BERT sentence embedding. Our proposed method uses BERT to generate embeddings for sentences of a given text and uses these embeddings as inputs for parallel lines of hidden layers in a neural network. These lines are finally concatenated to predict the target value. For evaluation purposes, we created a new dataset for humor detection consisting of 200k formal short texts (100k positive and 100k negative). Experimental results show that our proposed method can determine humor in short texts with accuracy and an F1-score of 98.2 percent. Our 8-layer model with 110M parameters outperforms all baseline models with a large margin, showing the importance of utilizing linguistic structure in machine learning models.


翻译:自动幽默检测在现代技术(如聊天室和虚拟助理)中具有有趣的应用案例。根据一般的幽默语言结构,本文提出一种新颖的方法,通过使用BERT句子嵌入短文本中检测幽默。我们建议的方法是用BERT生成特定文本的句子嵌入,并将这些嵌入作为神经网络中隐藏层平行线的投入。这些线条最终被归结为预测目标值。为了评估的目的,我们创建了一套新的幽默检测数据集,由200公里的正规短文本(100公里正数和100公里负数)组成。实验结果显示,我们提议的方法可以精确地确定短文本中的幽默,而F1-点为98.2%。。我们拥有110M参数的8层模型比所有基线模型大范围,表明在机器学习模型中使用语言结构的重要性。

0
下载
关闭预览

相关内容

简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
RoBERTa中文预训练模型:RoBERTa for Chinese
PaperWeekly
57+阅读 · 2019年9月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
LibRec 精选:BERT原理和应用的图文教程
LibRec智能推荐
5+阅读 · 2018年12月22日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
从 Word Embedding 到 Bert:一起肢解 Bert!
人工智能头条
17+阅读 · 2018年12月11日
论文浅尝 | Improved Neural Relation Detection for KBQA
开放知识图谱
13+阅读 · 2018年1月21日
Arxiv
3+阅读 · 2019年11月28日
How to Fine-Tune BERT for Text Classification?
Arxiv
13+阅读 · 2019年5月14日
Zero-Shot Object Detection
Arxiv
9+阅读 · 2018年7月27日
Arxiv
10+阅读 · 2018年3月22日
VIP会员
相关VIP内容
简明扼要!Python教程手册,206页pdf
专知会员服务
47+阅读 · 2020年3月24日
相关资讯
RoBERTa中文预训练模型:RoBERTa for Chinese
PaperWeekly
57+阅读 · 2019年9月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
LibRec 精选:BERT原理和应用的图文教程
LibRec智能推荐
5+阅读 · 2018年12月22日
Facebook PyText 在 Github 上开源了
AINLP
7+阅读 · 2018年12月14日
从 Word Embedding 到 Bert:一起肢解 Bert!
人工智能头条
17+阅读 · 2018年12月11日
论文浅尝 | Improved Neural Relation Detection for KBQA
开放知识图谱
13+阅读 · 2018年1月21日
Top
微信扫码咨询专知VIP会员