开源开放 | 开源大学在线实践数据集及知识图谱MOOPer(CCKS2021)

2021 年 8 月 11 日 开放知识图谱

OpenKG地址:http://openkg.cn/dataset/mooper

头歌平台:https://www.educoder.net/ch/rest

开放许可协议:CC BY-SA 4.0 (署名相似共享)

贡献者:湖南智擎科技有限公司(黄井泉),国防科技大学(刘坤佳 曾维新 廖劲智 赵翔 唐九阳 戴傲)



1. MOOPer介绍

MOOPer是一个大型在线开放实践数据集,由国防科技大学信息系统工程重点实验室贡献。MOOPer来源于大规模开放在线实践(Massive Open Online Practice,MOOP)这一概念,包含了2018-2019年间头歌平台(https://www.educoder.net)用户在线实践数据,其中用户与实践项目的辅助信息以知识图谱形式组织。

MOOPer数据集主要分为两个部分:交互数据与知识图谱。交互数据包含253万实践练习数据、2160万系统反馈数据以及1.5万论坛讨论数据。知识图谱包含11类实体,10类关系。MOOPer数据集结构如图1所示。

图1. MOOPer数据集结构
2. MOOPer构建
2.1 交互数据采集

用户与学习材料的交互被分为三组:用户行为、用户反馈和系统反馈。

用户行为:专注于实践练习的过程——用户答题正误情况,尝试次数,以及是否参考了答案等等。详尽的交互记录将最大程度再现用户交互过程,从而为进一步研究提供了更全面的信息。值得注意的是,所有记录都是匿名的,以保护用户的隐私。

用户反馈:提供用户对交互过的实践练习的评分。显示了用户对不同难度和问题类型的学习材料的偏好。此外,还提供了他们在论坛中的讨论内容。闲聊内容可以用来调查他们的学习状况和学习满意度,而问答讨论则反映了他们在知识掌握上的“盲点”。此外,用户在论坛的活跃度也是推测其心理状态和学习方式的重要指标。

系统反馈:提供系统对用户提交结果反馈——他们的代码是否有语法错误,提交代码的编译结果,实际输出和预期输出之间的差异等等。此类信息可以用于了解用户的学习能力和知识掌握情况。

2.2 知识图谱构建

丰富的辅助信息在实际任务中对于提升模型性能非常有用。MOOPer提供了丰富的实体、关系与属性信息,包括实践项目的介绍说明和具体内容等。知识图谱的结构如图1左图所示。 

学习资源之间存在自然的层次结构。一门课程可能包括几个章节和实践项目, 而一个实践项目由几个关卡组成,每个关卡又涵盖了不同的知识点。此外,不同课程可能会共享同样的实践项目,不同的关卡可能共享相同的知识点。这些相互引用进一步将层次结构扩展到图。

3. MOOPer规模和用途

MOOPer提供丰富的交互数据和全面的辅助信息,不仅可以支持多种任务,还为后续对不同领域的任务和模型进行融合提供了数据支持。

Dropout Prediction 辍学预测。根据学生的早期在课程学习中的行为数据预测其放弃该门课程的可能性。

Knowledge Tracing 知识追踪。根据学生过去的答题情况对学生的知识掌握情况进行建模,从而得到学生当前知识状态表示的一种技术。

Recommendation 学习材料推荐。根据用户的交互记录对用户喜好进行个性化建模,为其推荐感兴趣的学习材料(如课程、章节、知识点、实训、关卡等)。

Intelligent Tutoring 智能导学评估。建模学习者知识状态,模拟人类的1v1教学为用户提供学习指导。

  除此之外,由于MOOPer提供丰富的辅助信息知识图谱,因此可以支持不同任务的融合。可行的思路之一是将知识图谱表示学习与上述任务进行结合,例如可以将知识图谱嵌入(Knowledge Graph Embedding,KGE)、图神经网络(Graph Neural Network,GNN)、图卷积神经网络(Graph Convolution Graph)等算法与教育数据结合,使用辅助信息提升模型效果。

4. 结语与致谢

我们提出了MOOPer,一个以实践为中心的数据集,专注于在线学习中的实践过程,其中丰富的辅助信息被组织为知识图谱形式。灵活的数据组织形式使其可以支持教育领域多种数据挖掘任务,并且促进了这些任务与知识图谱研究的最新成果融合。

 


 

OpenKG


OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

点击阅读原文,进入 OpenKG 网站。

登录查看更多
0

相关内容

全国知识图谱与语义计算大会(CCKS: China Conference on Knowledge Graph and Semantic Computing)由中国中文信息学会语言与知识计算专委会定期举办的全国年度学术会议。CCKS源于国内两个主要的相关会议:中文知识图谱研讨会the Chinese Knowledge Graph Symposium (CKGS)和中国语义互联网与Web科学大会Chinese Semantic Web and Web Science Conference (CSWS)。 首届中文知识图谱研讨会于2013年在苏州举行,随后分别在武汉、宜昌成功举办第二次和第三次研讨会。CSWS首次会议于2006年在北京举办,随后的近十年里,逐渐成为国内语义技术领域的主要会议。新的知识图谱与语义计算大会将致力于成为国内知识图谱、语义技术、链接数据等领域的核心会议,并聚集了知识表示、自然语言理解、智能问答、知识抽取、链接数据、图数据库、图挖掘、自动推理等相关技术领域的重要学者和研究人员。
ACL2022 | 基于强化学习的实体对齐
专知会员服务
34+阅读 · 2022年3月15日
面向知识图谱的知识推理综述
专知会员服务
149+阅读 · 2021年11月1日
专知会员服务
19+阅读 · 2021年3月12日
【AAAI2021】知识图谱增强的预训练模型的生成式常识推理
【EMNLP2020-清华】基于常识知识图谱的多跳推理语言生成
专知会员服务
73+阅读 · 2020年9月25日
知识图谱本体结构构建论文合集
专知会员服务
106+阅读 · 2019年10月9日
开源开放 | 开源立体化漏洞情报知识图谱(四维创智)
开源开放 | 中国近代历史人物知识图谱
开放知识图谱
2+阅读 · 2021年12月3日
开源开放 | 计算机科学示意图问答数据集CSDQA(CCKS2021)
开源开放 | 高质量体育赛事摘要数据集SGSum(CCKS2021)
开放知识图谱
0+阅读 · 2021年9月10日
开源开放 | 多模态实体链接数据集MELBench(CCKS2021)
开放知识图谱
2+阅读 · 2021年8月13日
开源开放 | 移动应用知识图谱MAKG(CCKS2021)
开放知识图谱
0+阅读 · 2021年8月9日
开源开放 | 糖尿病知识图谱DiaKG(CCKS2021)
开放知识图谱
3+阅读 · 2021年8月8日
开源开放|CCKS2021入选开放图谱资源简介
开放知识图谱
0+阅读 · 2021年8月6日
历史最全-16个推荐系统开放公共数据集整理分享
深度学习与NLP
22+阅读 · 2018年7月28日
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年4月18日
Arxiv
101+阅读 · 2020年3月4日
VIP会员
相关VIP内容
相关资讯
开源开放 | 开源立体化漏洞情报知识图谱(四维创智)
开源开放 | 中国近代历史人物知识图谱
开放知识图谱
2+阅读 · 2021年12月3日
开源开放 | 计算机科学示意图问答数据集CSDQA(CCKS2021)
开源开放 | 高质量体育赛事摘要数据集SGSum(CCKS2021)
开放知识图谱
0+阅读 · 2021年9月10日
开源开放 | 多模态实体链接数据集MELBench(CCKS2021)
开放知识图谱
2+阅读 · 2021年8月13日
开源开放 | 移动应用知识图谱MAKG(CCKS2021)
开放知识图谱
0+阅读 · 2021年8月9日
开源开放 | 糖尿病知识图谱DiaKG(CCKS2021)
开放知识图谱
3+阅读 · 2021年8月8日
开源开放|CCKS2021入选开放图谱资源简介
开放知识图谱
0+阅读 · 2021年8月6日
历史最全-16个推荐系统开放公共数据集整理分享
深度学习与NLP
22+阅读 · 2018年7月28日
相关基金
国家自然科学基金
1+阅读 · 2015年12月31日
国家自然科学基金
4+阅读 · 2014年12月31日
国家自然科学基金
26+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
3+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
5+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员