Classic information extraction techniques consist in building questions and answers about the facts. Indeed, it is still a challenge to subjective information extraction systems to identify opinions and feelings in context. In sentiment-based NLP tasks, there are few resources to information extraction, above all offensive or hateful opinions in context. To fill this important gap, this short paper provides a new cross-lingual and contextual offensive lexicon, which consists of explicit and implicit offensive and swearing expressions of opinion, which were annotated in two different classes: context dependent and context-independent offensive. In addition, we provide markers to identify hate speech. Annotation approach was evaluated at the expression-level and achieves high human inter-annotator agreement. The provided offensive lexicon is available in Portuguese and English languages.


翻译:传统信息提取技术包括建立对事实的问答,事实上,这仍然是主观信息提取系统在识别背景中的观点和感觉方面所面临的挑战。在基于情绪的NLP任务中,信息提取资源很少,尤其是攻击性或仇恨性观点。为填补这一重要空白,这份短文提供了一个新的跨语言和背景攻击性词汇,由明确和隐含的冒犯和咒骂性意见表达组成,在两种不同的类别中作了说明:背景依赖和背景独立的攻击。此外,我们还提供了识别仇恨言论的标志。在表达层面对批注方法进行了评估,并达成了高水平的人类间批注协议。所提供的攻击性词汇以葡萄牙语和英语提供。

0
下载
关闭预览

相关内容

边缘机器学习,21页ppt
专知会员服务
83+阅读 · 2021年6月21日
专知会员服务
40+阅读 · 2020年9月6日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
109+阅读 · 2020年6月10日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
53+阅读 · 2019年9月29日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
已删除
将门创投
10+阅读 · 2019年3月6日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Hierarchical Disentangled Representations
CreateAMind
4+阅读 · 2018年4月15日
计算机类 | 期刊专刊截稿信息9条
Call4Papers
4+阅读 · 2018年1月26日
Arxiv
0+阅读 · 2021年10月5日
Revealing the Dark Secrets of BERT
Arxiv
4+阅读 · 2019年9月11日
Arxiv
3+阅读 · 2019年3月1日
Arxiv
5+阅读 · 2018年1月23日
VIP会员
相关VIP内容
Top
微信扫码咨询专知VIP会员