项目名称: 克隆代码检测及基于进化的有害性预测研究
项目编号: No.61363017
项目类型: 地区科学基金项目
立项/批准年度: 2013
项目学科: 自动化技术、计算机技术
项目作者: 刘东升
作者单位: 内蒙古师范大学
项目金额: 45万元
中文摘要: 克隆代码检测、管理和理解是软件工程的重要研究内容,其在软件维护、复杂性、架构、复用、进化,及软件授权、反剽窃等众多领域有广泛的需求与应用。本项目基于既有研究成果,围绕"克隆检测时空复杂度"、"连续版本间克隆群映射"、"直系克隆群集主题识别"、"克隆有害性预测"等四个核心问题深入开展具体研究。通过选取适当克隆代码粒度与类型特征,使用基于优化后缀数组的改进算法检测软件各版本中克隆代码;采用Token串与AST相结合的技术,建立克隆群的映射关系,提取对应克隆家系;利用LDA模型识别直系克隆群集主题,获取克隆代码上下文进化信息;进而运用Bayes模型预测克隆代码有害程度。最终实现一个与程序设计语言无关、可移植、可视化的克隆代码有害性自动预测实验系统。预期成果将为软件系统的开发维护提供有价值的克隆代码有害性参考,从而以更低经济成本进行升级与维护,并为评估软件质量和可信性提供有力支持。
中文关键词: 克隆代码;克隆检测;进化;有害性预测;
英文摘要: Clone detection, management and understanding are significant researches in software engineering. They have wide requirements and applications in many fields, such as software maintenance, complexity, architecture, reuse, evolution, licensing, anti-plagia
英文关键词: Code Clone;Clone Detection;Evolution Strategy;Harmfulness Prediction;