Recently the NLP community has started showing interest towards the challenging task of Hostile Post Detection. This paper present our system for Shared Task at Constraint2021 on "Hostile Post Detection in Hindi". The data for this shared task is provided in Hindi Devanagari script which was collected from Twitter and Facebook. It is a multi-label multi-class classification problem where each data instance is annotated into one or more of the five classes: fake, hate, offensive, defamation, and non-hostile. We propose a two level architecture which is made up of BERT based classifiers and statistical classifiers to solve this problem. Our team 'Albatross', scored 0.9709 Coarse grained hostility F1 score measure on Hostile Post Detection in Hindi subtask and secured 2nd rank out of 45 teams for the task. Our submission is ranked 2nd and 3rd out of a total of 156 submissions with Coarse grained hostility F1 score of 0.9709 and 0.9703 respectively. Our fine grained scores are also very encouraging and can be improved with further finetuning. The code is publicly available.


翻译:最近,NLP社区开始对具有挑战性的敌对事件探测任务表现出兴趣。 本文展示了我们在2021年Cstraintin关于“ 印地语中Hostile Post Setation in In Indhi” 的共享任务系统中的共享任务系统。 共享任务的数据由Twitter 和 Facebook 收集的印地语 Devanagari 脚本中提供。 这是一个多标签的多级分类问题, 每个数据实例都标记成五类中的一类或数类: 假的、 仇恨的、 冒犯的、 诽谤的和非敌对的。 我们提出了一个由基于BERT的分类员和统计分类员组成的两级架构来解决这个问题。 我们的团队“ Albatross ” 在印地语子中的敌对事件后探测得分为 0. 9709 7 粗粮的F1, 并且为这项任务在45个团队中获得了第2级。 我们的提交材料在总共156份中排第2和第3级, 分别是 0. 0. 9709 和0. 9703 0. 9703 3 。 我们的精细的谷物分也非常令人鼓舞, 并且可以进一步改进。

0
下载
关闭预览

相关内容

专知会员服务
124+阅读 · 2020年9月8日
强化学习最新教程,17页pdf
专知会员服务
177+阅读 · 2019年10月11日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
104+阅读 · 2019年10月9日
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
车辆目标检测
数据挖掘入门与实战
30+阅读 · 2018年3月30日
机器人开发库软件大列表
专知
10+阅读 · 2018年3月18日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
BranchOut: Regularization for Online Ensemble Tracking with CNN
统计学习与视觉计算组
9+阅读 · 2017年10月7日
Arxiv
0+阅读 · 2021年3月15日
Arxiv
24+阅读 · 2020年3月11日
Arxiv
26+阅读 · 2020年2月21日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
9+阅读 · 2018年4月12日
Arxiv
7+阅读 · 2018年3月19日
VIP会员
相关资讯
无人机视觉挑战赛 | ICCV 2019 Workshop—VisDrone2019
PaperWeekly
7+阅读 · 2019年5月5日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
Ray RLlib: Scalable 降龙十八掌
CreateAMind
9+阅读 · 2018年12月28日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
车辆目标检测
数据挖掘入门与实战
30+阅读 · 2018年3月30日
机器人开发库软件大列表
专知
10+阅读 · 2018年3月18日
上百份文字的检测与识别资源,包含数据集、code和paper
数据挖掘入门与实战
17+阅读 · 2017年12月7日
【推荐】YOLO实时目标检测(6fps)
机器学习研究会
20+阅读 · 2017年11月5日
BranchOut: Regularization for Online Ensemble Tracking with CNN
统计学习与视觉计算组
9+阅读 · 2017年10月7日
相关论文
Arxiv
0+阅读 · 2021年3月15日
Arxiv
24+阅读 · 2020年3月11日
Arxiv
26+阅读 · 2020年2月21日
Arxiv
11+阅读 · 2019年4月15日
Arxiv
5+阅读 · 2018年10月4日
Arxiv
9+阅读 · 2018年4月12日
Arxiv
7+阅读 · 2018年3月19日
Top
微信扫码咨询专知VIP会员