The increased proliferation of abusive content on social media platforms has a negative impact on online users. The dread, dislike, discomfort, or mistrust of lesbian, gay, transgender or bisexual persons is defined as homophobia/transphobia. Homophobic/transphobic speech is a type of offensive language that may be summarized as hate speech directed toward LGBT+ people, and it has been a growing concern in recent years. Online homophobia/transphobia is a severe societal problem that can make online platforms poisonous and unwelcome to LGBT+ people while also attempting to eliminate equality, diversity, and inclusion. We provide a new hierarchical taxonomy for online homophobia and transphobia, as well as an expert-labelled dataset that will allow homophobic/transphobic content to be automatically identified. We educated annotators and supplied them with comprehensive annotation rules because this is a sensitive issue, and we previously discovered that untrained crowdsourcing annotators struggle with diagnosing homophobia due to cultural and other prejudices. The dataset comprises 15,141 annotated multilingual comments. This paper describes the process of building the dataset, qualitative analysis of data, and inter-annotator agreement. In addition, we create baseline models for the dataset. To the best of our knowledge, our dataset is the first such dataset created. Warning: This paper contains explicit statements of homophobia, transphobia, stereotypes which may be distressing to some readers.


翻译:社交媒体平台上滥用内容的增多对在线用户产生了负面影响。对男女同性恋、双性恋或双性恋者的恐惧、不喜欢、不适、不适或不信任被定义为对同性恋的憎恶/仇视。仇视同性恋/变性言论是一种冒犯性语言,可被概括为针对男女同性恋、双性恋和变性者的仇恨言论,近年来,这日益成为人们关注的一个问题。在线仇视同性恋/仇视变性者是一个严重的社会问题,使在线平台对男女同性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、性恋、恋、恋、和恋、恋、恋、恋、恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、双性恋、性恋、双性恋、双性恋、双性恋

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
Linux导论,Introduction to Linux,96页ppt
专知会员服务
77+阅读 · 2020年7月26日
因果图,Causal Graphs,52页ppt
专知会员服务
246+阅读 · 2020年4月19日
100+篇《自监督学习(Self-Supervised Learning)》论文最新合集
专知会员服务
164+阅读 · 2020年3月18日
强化学习最新教程,17页pdf
专知会员服务
174+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
77+阅读 · 2019年10月10日
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机类 | SIGMETRICS 2019等国际会议信息7条
Call4Papers
9+阅读 · 2018年10月23日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
多目标的强化学习教程
CreateAMind
4+阅读 · 2018年1月25日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Arxiv
0+阅读 · 2021年10月17日
Arxiv
3+阅读 · 2018年4月10日
Arxiv
5+阅读 · 2018年1月23日
VIP会员
相关资讯
LibRec 精选:AutoML for Contextual Bandits
LibRec智能推荐
7+阅读 · 2019年9月19日
计算机 | CCF推荐期刊专刊信息5条
Call4Papers
3+阅读 · 2019年4月10日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
计算机类 | SIGMETRICS 2019等国际会议信息7条
Call4Papers
9+阅读 · 2018年10月23日
【SIGIR2018】五篇对抗训练文章
专知
12+阅读 · 2018年7月9日
多目标的强化学习教程
CreateAMind
4+阅读 · 2018年1月25日
【推荐】RNN/LSTM时序预测
机器学习研究会
25+阅读 · 2017年9月8日
Auto-Encoding GAN
CreateAMind
7+阅读 · 2017年8月4日
强化学习族谱
CreateAMind
26+阅读 · 2017年8月2日
Top
微信扫码咨询专知VIP会员