Defect identification at commit check-in time prevents the introduction of defects into software. Current defect identification approaches either rely on manually crafted features such as change metrics or involve training expensive machine learning or deep learning models. By relying on a complex underlying model, these approaches are not often explainable, which means the models' predictions cannot be understood by the developers. An approach that is not explainable might not be adopted in real-life development environments because of developers' lack of trust in its results. Furthermore, because of an extensive training process, these approaches cannot readily learn from new examples when they arrive, making them unsuitable for fast online prediction. To address these limitations, we propose an approach called IRJIT that employs information retrieval on source code, and labels new commits as buggy or clean based on their similarity to past buggy or clean commits. Our approach is online and explainable as it can learn from new data without retraining, and developers can see the documents that support a prediction. Through an evaluation of 8 open-source projects, we show that IRJIT achieves AUC and F1 score close to the state-of-the-art machine learning approach JITLine, without considerable re-training.


翻译:进行检查时发现缺陷后无法将缺陷引入软件。 目前的缺陷识别方法要么依靠人工制作的特征,如变化度量,要么涉及培训昂贵的机器学习或深层学习模式。 依靠复杂的基本模型,这些方法往往不易解释,这意味着模型的预测不能为开发者所理解。 在现实发展环境中,由于开发者对结果缺乏信任,在实际发展环境中可能无法解释这种方法。 此外,由于培训过程广泛,这些方法在到达时无法随时从新的例子中学习,因此不适合快速在线预测。为了解决这些限制,我们建议采用称作IRJIT的方法,即使用源码信息检索,并且根据与过去的错误或清洁承诺相似性,将新的标签当作错误或清洁。我们的方法是在线的,因为开发者可以在没有再培训的情况下从新数据中学习,因此无法解释,而且开发者可以看到支持预测的文件。 通过对8个公开源项目进行评估,我们显示IRJIT公司在接近州级机器学习方法的情况下取得了AUC和F1分。

0
下载
关闭预览

相关内容

《计算机信息》杂志发表高质量的论文,扩大了运筹学和计算的范围,寻求有关理论、方法、实验、系统和应用方面的原创研究论文、新颖的调查和教程论文,以及描述新的和有用的软件工具的论文。官网链接:https://pubsonline.informs.org/journal/ijoc
强化学习最新教程,17页pdf
专知会员服务
167+阅读 · 2019年10月11日
2019年机器学习框架回顾
专知会员服务
35+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
IEEE ICKG 2022: Call for Papers
机器学习与推荐算法
3+阅读 · 2022年3月30日
ACM MM 2022 Call for Papers
CCF多媒体专委会
5+阅读 · 2022年3月29日
【ICIG2021】Latest News & Announcements of the Workshop
中国图象图形学学会CSIG
0+阅读 · 2021年12月20日
【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium7
中国图象图形学学会CSIG
0+阅读 · 2021年11月15日
【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium4
中国图象图形学学会CSIG
0+阅读 · 2021年11月10日
【ICIG2021】Latest News & Announcements of the Plenary Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年11月2日
【ICIG2021】Latest News & Announcements of the Plenary Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年11月1日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Arxiv
0+阅读 · 2022年11月9日
Arxiv
15+阅读 · 2021年7月14日
VIP会员
相关资讯
IEEE ICKG 2022: Call for Papers
机器学习与推荐算法
3+阅读 · 2022年3月30日
ACM MM 2022 Call for Papers
CCF多媒体专委会
5+阅读 · 2022年3月29日
【ICIG2021】Latest News & Announcements of the Workshop
中国图象图形学学会CSIG
0+阅读 · 2021年12月20日
【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium7
中国图象图形学学会CSIG
0+阅读 · 2021年11月15日
【ICIG2021】Check out the hot new trailer of ICIG2021 Symposium4
中国图象图形学学会CSIG
0+阅读 · 2021年11月10日
【ICIG2021】Latest News & Announcements of the Plenary Talk2
中国图象图形学学会CSIG
0+阅读 · 2021年11月2日
【ICIG2021】Latest News & Announcements of the Plenary Talk1
中国图象图形学学会CSIG
0+阅读 · 2021年11月1日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
Transferring Knowledge across Learning Processes
CreateAMind
25+阅读 · 2019年5月18日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
相关基金
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2014年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2013年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2012年12月31日
国家自然科学基金
0+阅读 · 2011年12月31日
国家自然科学基金
0+阅读 · 2008年12月31日
Top
微信扫码咨询专知VIP会员