项目名称: 基于深度神经网络的自动作文评分算法研究

项目编号: No.61472391

项目类型: 面上项目

立项/批准年度: 2015

项目学科: 计算机科学学科

项目作者: 何苯

作者单位: 中国科学院大学

项目金额: 80万元

中文摘要: 在自动作文评分系统中, 对能够衡量作文水平与质量的特征的提取是保证评分准确性的关键技术手段。当前的自动作文评分算法普遍采用文章长度、语法错误等浅层特征,然而受限于目前自然语言处理技术水平,这些特征仅能在词法句法层面有效反应作文写作质量,而对于语义内容层面则仅能定制出较为浅层的特征,无法正确表示作文的上下文语义内容。申请人在前期工作探索了多种自动作文评分方法和评分模型常用特征与写作质量的相关性和泛化能力,归纳出当前自动作文评分技术因受限于所用特征的浅层性问题,导致该技术的鲁棒性和有效性受到严重制约。在此基础上,本研究拟基于深度学习技术构建新的自动作文评分算法,通过挖掘深层次的、能够有效反应文章写作质量的语义特征, 进而训练基于深度神经网络的自动作文评分模型,并在ASAP与HSK等公开中英文作文数据集上通过多重交叉检验进行性能验证评价,以期能显著提升现有评分系统的人机一致率和鲁棒性。

中文关键词: 自然语言处理;深度学习;自动作文评分

英文摘要: Automated essay scoring (AES) utilizes pre-defined features to measure the writing quality of essays. However, due to the limits of the existing natural language processing techniques, current AES systems are only capable of making use of shallow text features such as the essay length and the number of grammar errors. As a consequence, current AES systems are not able to represent the exact semantic content of essays, resulting in limited robustness and effectiveness. To this end, we have investigated the relationship between various pre-defined features and the writing quality. Based on our prior studies, this project aims to develop a novel AES algorithm based on deep neural networks (DNN) by mining deep semantic features which can effectively reflect essay writing quality. The evaluation of the essay rating model trained by the new algorithm is planned to be done by cross-validation on the ASAP and HSK public datasets, which are in English and Chinese, respectively. Our proposed approach is expected to show significantly improved effectiveness in terms of human-machine agreement and robustness in the experiments.

英文关键词: Natural language processing;Deep learning;Automated essay scoring

成为VIP会员查看完整内容
1

相关内容

自然语言处理(NLP)是语言学,计算机科学,信息工程和人工智能的一个子领域,与计算机和人类(自然)语言之间的相互作用有关,尤其是如何对计算机进行编程以处理和分析大量自然语言数据 。

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
专知会员服务
13+阅读 · 2021年8月28日
专知会员服务
17+阅读 · 2021年7月3日
专知会员服务
45+阅读 · 2021年5月17日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
114+阅读 · 2021年1月11日
专知会员服务
97+阅读 · 2020年12月8日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
你会信任哪些平台的评分评价?
ZEALER订阅号
0+阅读 · 2022年3月20日
基于Pytorch的开源推荐算法库
机器学习与推荐算法
1+阅读 · 2021年10月12日
神经机器阅读理解最新综述:方法和趋势
PaperWeekly
15+阅读 · 2019年7月25日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
已删除
将门创投
13+阅读 · 2019年4月17日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
LibRec 每周算法:DeepFM
LibRec智能推荐
14+阅读 · 2017年11月6日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
46+阅读 · 2021年10月4日
Meta-Learning to Cluster
Arxiv
17+阅读 · 2019年10月30日
小贴士
相关VIP内容
专知会员服务
13+阅读 · 2021年8月28日
专知会员服务
17+阅读 · 2021年7月3日
专知会员服务
45+阅读 · 2021年5月17日
专知会员服务
43+阅读 · 2021年1月18日
专知会员服务
114+阅读 · 2021年1月11日
专知会员服务
97+阅读 · 2020年12月8日
【哈工大】基于抽取的高考作文生成
专知会员服务
36+阅读 · 2020年3月10日
相关资讯
你会信任哪些平台的评分评价?
ZEALER订阅号
0+阅读 · 2022年3月20日
基于Pytorch的开源推荐算法库
机器学习与推荐算法
1+阅读 · 2021年10月12日
神经机器阅读理解最新综述:方法和趋势
PaperWeekly
15+阅读 · 2019年7月25日
深度学习与医学图像分析
人工智能前沿讲习班
40+阅读 · 2019年6月8日
已删除
将门创投
13+阅读 · 2019年4月17日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
LibRec 每周算法:DeepFM
LibRec智能推荐
14+阅读 · 2017年11月6日
相关基金
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
6+阅读 · 2015年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2013年12月31日
国家自然科学基金
4+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2009年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
微信扫码咨询专知VIP会员