项目名称: 基于机器学习的软件度量分析

项目编号: No.60903103

项目类型: 青年科学基金项目

立项/批准年度: 2010

项目学科: 轻工业、手工业

项目作者: 黎铭

作者单位: 南京大学

项目金额: 19万元

中文摘要: 机器学习已成为各领域中进行智能数据分析的重要途径。在软件度量分析中,多种经典机器学习技术已被用于分析现有度量与所关注的目标之间的关系,从建立的模型中可发现与所关注目标密切相关的关键度量。然而,大多数软件度量分析任务中的数据均不满足经典机器学习方法奏效所依赖的假设,从而会导致预测模型不能完全反映真实规律。本课题拟对适合于软件度量分析任务特点的学习建模方法进行研究,提出一种能够主动地从备选样本空间有选择性地采样并获取标记以供学习的学习方法;提出一种能够利用大量难以获得标记的样本提升学习能力的学习方法;提出一种对目标类错误分类代价敏感的学习方法;提出一种能够针对目标类样本比例较小的数据进行有效学习的学习方法;并基于上述理论成果建立反映现有软件度量与程序缺陷之间关系的预测模型。本课题可望在重要国际期刊、会议和国内一级学报上发表高质量论文4-6篇,申请国家发明专利1-2项,培养研究生2-3名。

中文关键词: 机器学习;软件度量;利用无标注数据学习;代价敏感学习;类别不平衡学习

英文摘要:

英文关键词: machine learning;software metrics;learning from unlabeled data;cost-sensitive learning;imbalanced learning

成为VIP会员查看完整内容
1

相关内容

“机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让 可以自动“ 学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。很多 推论问题属于 无程序可循难度,所以部分的机器学习研究是开发容易处理的近似算法。” ——中文维基百科

知识荟萃

精品入门和进阶教程、论文和代码整理等

更多

查看相关VIP内容、论文、资讯等
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
60+阅读 · 2021年4月21日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
76+阅读 · 2021年2月24日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
61+阅读 · 2021年2月16日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
37+阅读 · 2019年10月9日
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
商汤科技SCG招聘实习生(内推)
CVer
0+阅读 · 2021年12月2日
机器学习中的数据级联
TensorFlow
0+阅读 · 2021年7月15日
表面缺陷检测数据集汇总及其相关项目推荐
极市平台
31+阅读 · 2020年6月20日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月20日
Arxiv
0+阅读 · 2022年4月14日
Arxiv
0+阅读 · 2022年4月14日
Recent advances in deep learning theory
Arxiv
50+阅读 · 2020年12月20日
AdarGCN: Adaptive Aggregation GCN for Few-Shot Learning
小贴士
相关VIP内容
【博士论文】分形计算系统
专知会员服务
32+阅读 · 2021年12月9日
【博士论文】机器学习中的标记增强理论 与应用研究
专知会员服务
28+阅读 · 2021年12月3日
算法分析导论, 593页pdf
专知会员服务
144+阅读 · 2021年8月30日
【SIGIR2021】基于嵌入的增量式时序知识图谱补全框架
专知会员服务
60+阅读 · 2021年4月21日
【经典书】统计强化学习:现代机器学习方法,206页pdf
专知会员服务
76+阅读 · 2021年2月24日
【经典书】R机器学习入门:严格的数学分析,225页pdf
专知会员服务
61+阅读 · 2021年2月16日
基于机器学习的数据库技术综述
专知会员服务
53+阅读 · 2021年1月2日
机器学习相关资源(框架、库、软件)大列表
专知会员服务
37+阅读 · 2019年10月9日
相关资讯
基于机器学习的自动化网络流量分析
CCF计算机安全专委会
4+阅读 · 2022年4月8日
商汤科技SCG招聘实习生(内推)
CVer
0+阅读 · 2021年12月2日
机器学习中的数据级联
TensorFlow
0+阅读 · 2021年7月15日
表面缺陷检测数据集汇总及其相关项目推荐
极市平台
31+阅读 · 2020年6月20日
【机器学习】深入剖析机器学习中的统计思想
产业智能官
14+阅读 · 2019年1月24日
基于信息理论的机器学习
专知
21+阅读 · 2017年11月23日
相关基金
国家自然科学基金
14+阅读 · 2015年12月31日
国家自然科学基金
2+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2014年12月31日
国家自然科学基金
1+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
2+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
1+阅读 · 2011年12月31日
微信扫码咨询专知VIP会员