English proficiency assessments have become a necessary metric for filtering and selecting prospective candidates for both academia and industry. With the rise in demand for such assessments, it has become increasingly necessary to have the automated human-interpretable results to prevent inconsistencies and ensure meaningful feedback to the second language learners. Feature-based classical approaches have been more interpretable in understanding what the scoring model learns. Therefore, in this work, we utilize classical machine learning models to formulate a speech scoring task as both a classification and a regression problem, followed by a thorough study to interpret and study the relation between the linguistic cues and the English proficiency level of the speaker. First, we extract linguist features under five categories (fluency, pronunciation, content, grammar and vocabulary, and acoustic) and train models to grade responses. In comparison, we find that the regression-based models perform equivalent to or better than the classification approach. Second, we perform ablation studies to understand the impact of each of the feature and feature categories on the performance of proficiency grading. Further, to understand individual feature contributions, we present the importance of top features on the best performing algorithm for the grading task. Third, we make use of Partial Dependence Plots and Shapley values to explore feature importance and conclude that the best performing trained model learns the underlying rubrics used for grading the dataset used in this study.


翻译:英国熟练程度评估已成为为学术界和产业界筛选和挑选潜在候选人的必要衡量标准。随着对此类评估的需求增加,越来越有必要采用自动化的人类解释结果,以防止不一致,确保向第二语言学习者提供有意义的反馈。基于地貌的古典方法在理解评分模型所学的东西方面更易于解释。因此,在这项工作中,我们利用古典机器学习模型来制定语音评分任务,既作为一种分类,又是一个回归问题,随后进行透彻研究,解释和研究语言提示与演讲者英语熟练程度之间的关系。首先,我们从五类(流、发音、内容、语法和词汇以及声学)中提取语言学特征,并培训年级反应模型。相比之下,我们发现基于回归模型的模型与分类方法相同或更好。第二,我们进行相关研究,以了解每个特征和特征类别对资格分级工作的影响。此外,为了了解个人特征贡献,我们介绍了在进行这一评级任务中最优秀的算法的重要性(流、发、发音、内容、语法和声学),我们利用这一经过培训的分级模型进行最佳的分级研究。

0
下载
关闭预览

相关内容

自然语言处理顶会COLING2020最佳论文出炉!
专知会员服务
23+阅读 · 2020年12月12日
知识图谱推理,50页ppt,Salesforce首席科学家Richard Socher
专知会员服务
105+阅读 · 2020年6月10日
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
【哈佛大学商学院课程Fall 2019】机器学习可解释性
专知会员服务
101+阅读 · 2019年10月9日
已删除
将门创投
5+阅读 · 2019年9月10日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
学术会议 | 知识图谱顶会 ISWC 征稿:Poster/Demo
开放知识图谱
5+阅读 · 2019年4月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
10页MIT可解释机器学习最新论文
专知
5+阅读 · 2019年2月22日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Arxiv
0+阅读 · 2022年1月28日
Arxiv
19+阅读 · 2018年10月25日
VIP会员
相关资讯
已删除
将门创投
5+阅读 · 2019年9月10日
计算机 | IUI 2020等国际会议信息4条
Call4Papers
6+阅读 · 2019年6月17日
学术会议 | 知识图谱顶会 ISWC 征稿:Poster/Demo
开放知识图谱
5+阅读 · 2019年4月16日
Call for Participation: Shared Tasks in NLPCC 2019
中国计算机学会
5+阅读 · 2019年3月22日
10页MIT可解释机器学习最新论文
专知
5+阅读 · 2019年2月22日
Linguistically Regularized LSTMs for Sentiment Classification
黑龙江大学自然语言处理实验室
8+阅读 · 2018年5月4日
Capsule Networks解析
机器学习研究会
11+阅读 · 2017年11月12日
Top
微信扫码咨询专知VIP会员