In this paper I present a classifier for automatic identification of linguistic politeness in Hindi texts. I have used the manually annotated corpus of over 25,000 blog comments to train an SVM. Making use of the discursive and interactional approaches to politeness the paper gives an exposition of the normative, conventionalised politeness structures of Hindi. It is seen that using these manually recognised structures as features in training the SVM significantly improves the performance of the classifier on the test set. The trained system gives a significantly high accuracy of over 77% which is within 2% of human accuracy.


翻译:在本文中,我提出了一个用于自动识别印地语文本语言礼貌的分类器,我使用25 000多份博客评论的人工附加说明文集来培训SVM。利用对礼貌的不准确和互动方法,本文对印地语规范、传统化的礼貌结构进行了阐述。人们看到,使用这些人工识别的结构作为培训印地语文本的特征,极大地提高了SVM在测试集上的性能。经过培训的系统给出了超过77%的高精度,在人精度的2%之内。

0
下载
关闭预览

相关内容

机器学习系统设计系统评估标准
ICML 2021论文收录
专知会员服务
122+阅读 · 2021年5月8日
专知会员服务
54+阅读 · 2020年10月11日
零样本文本分类,Zero-Shot Learning for Text Classification
专知会员服务
95+阅读 · 2020年5月31日
已删除
将门创投
8+阅读 · 2019年8月28日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
ACL 2018 计算语言学协会接受论文列表
专知
3+阅读 · 2018年4月27日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Arxiv
4+阅读 · 2018年1月29日
VIP会员
相关资讯
已删除
将门创投
8+阅读 · 2019年8月28日
Hierarchically Structured Meta-learning
CreateAMind
26+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
28+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
ACL 2018 计算语言学协会接受论文列表
专知
3+阅读 · 2018年4月27日
【今日新增】IEEE Trans.专刊截稿信息8条
Call4Papers
7+阅读 · 2017年6月29日
Top
微信扫码咨询专知VIP会员