在线学习平台上记录了大量基于文本的学生评论反馈,如何挖掘这些评论文本中隐含的有效信息,受到众多研究者的关注。情绪分析是文本挖掘的重要研究方向,近年来已应用于众多领域。与网络舆论、商品评论等领域不同,学生评论中还隐藏了学业情绪,包含积极高唤醒、消极高唤醒、积极低唤醒、消极低唤醒四类学业情绪(Pekrun et al.,2011)。这些学业情绪影响着学生的身心健康、认知过程等(Ainley et al.,2005;Pekrun et al.,2002)。关注学生的学业情绪对学生的认知提升、身心健康的发展都有重要意义。传统的学业情绪测量方法主要基于访谈和测量问卷,但由于规模限制,这种测量方法难以广泛应用于实际教学。随着人工智能技术的快速发展,采用机器学习的方法自动化、智能化地识别学业情绪是一种新的发展趋势。本研究基于深度学习中的长短期记忆网络(Long Short- Term Memory,简称LSTM)构建教育领域学业情绪识别模型,通过将LSTM模型与教育领域深度融合,快速发现学生反馈文本中的学业情绪类型,为自动化识别学业情绪提供一种新的手段和方法。
一、研究综述
(一)学业情绪
学生在学习过程中能够体会到不同的情绪,例如对一门课程或知识点掌握后的愉快感、考试过程中的焦虑感等。这些学习体验与课堂教学、课外学习和学业成就有直接关系。2002年,德国心理学家佩克伦等(Pekrun et al.,2002)将学习过程所有环节中与学生学业学习活动体验相关的各种情绪统称为学业情绪。俞国良等人(2005)将学业情绪的范围进一步扩大,认为它不仅包括学生在获悉学业成功或失败后所体验到的各种情绪,还包括在课堂学习、日常完成作业过程中以及在考试期间的情绪体验等。
学业情绪对学生成长的重要性不容忽视。美国教育研究联合会在1998年召开了主题为“情绪在学生与学业成就中的关系”的年度学术会议,突出了情绪研究对学生与学业的重要性。佩克伦等(Pekrun et al.,2002)指出学业情绪与学业动机、兴趣、意愿和努力等联系密切。情感、情绪、态度等因素对问题解决能力也有重要影响(魏雪峰,2017)。诸多实证研究(王瑞红,2009;俞国良,董妍,2005)表明,学业情绪在很大程度上能够预测学生的学业成就。海亚特等人(Hayat et al.,2018)通过收集800名医学院学生的学业情绪相关数据,发现积极的学业情绪(如希望、自豪等)与学业成绩有显著的正相关关系,享受、希望、骄傲和羞愧的学业情绪可以预测学生学业成绩的差异。王瑞红(2010)通过对398名高职院校的学生进行问卷调查和学业成绩测量,发现学生学业情绪各量表分数与学业成绩之间存在相关关系。
早期对学业情绪的研究主要集中在负面情绪,教师希望掌握学生在考试过程中所经历的焦虑、学习过程中的学业倦怠。在学业情绪的分类上多数学者将其分为积极和消极两个维度,如正性负性情绪自评量表(The Positive and Negative Affect Scale),但这种分类方法难以包含学生学习过程中经历的所有情绪体验。
佩克伦等(Pekrun et al.,2011)在学业情绪理论的基础上,以愉悦度和唤醒水平为分类标准进行研究后发现,不同年龄段学生所经历的学业情绪也会有细微差别。1993年,布莱恩·派崔克(Bian Patrick)及其研究团队研究了儿童在学习活动中所经历的学业情绪,发现积极情绪(兴趣、高兴、放松)、厌倦、痛苦和生气四类情绪是学习活动中主要的情绪体验(Patrick et al.,1993)。董妍等(2007)基于莱因哈德等人的研究,以青少年为研究对象,将学业情绪划分为四个维度:积极高唤醒、积极低唤醒、消极高唤醒、消极低唤醒。其中,积极高唤醒包括自豪、高兴、希望等情绪,积极低唤醒包括满足、平静、放松等情绪,消极高唤醒包括焦虑、羞愧、生气等情绪,消极低唤醒包括厌倦、无助、沮丧、疲乏心烦等情绪。马惠霞等(2010)也遵循佩克伦等人的学业情绪理论,将大学生学业情绪分为四个维度:积极高唤醒(兴趣、愉快、希望)、积极低唤醒(自豪和放松)、消极高唤醒(羞愧、焦虑、气愤)、消极低唤醒(失望和厌烦)。
情绪分析的无监督学习方法,主要包含基于词典和基于规则的方法。这两种方法基于语言学的思想,只需给定数据资源和设置语句的分析规则就能识别出句子的情绪。文本情绪集中体现于某些情绪词中,如“这节课的知识点我已经掌握了,很开心”这句文本中,情绪主要体现在“开心”一词中,使用基于词典的方法能够快速识别文本句子中所体现的情绪类别,且准确率非常高。有研究(Quan & Ren,2009)基于大量博客文本构建了情绪语料库,语料库中的词汇包含八种情感类别:期望、喜悦、爱、惊喜、焦虑、悲伤、愤怒和憎恨。也有研究(Taboada et al.,2011)提出了一套更全面的算法和规则,将情感判断对象从形容词、副词扩展到名词、动词等词性,同时引入否定词和强调词等特征辅助判别文本的情感倾向,在众多领域的情感分类语料上都取得较好的效果。