项目名称: 基于机器学习的软件度量分析
项目编号: No.60903103
项目类型: 青年科学基金项目
立项/批准年度: 2010
项目学科: 轻工业、手工业
项目作者: 黎铭
作者单位: 南京大学
项目金额: 19万元
中文摘要: 机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。
中文关键词: 机器学习;软件度量;利用无标注数据学习;代价敏感学习;类别不平衡学习
英文摘要:
英文关键词: machine learning;software metrics;learning from unlabeled data;cost-sensitive learning;imbalanced learning