Locating bugs is an important, but effort-intensive and time-consuming task, when dealing with large-scale systems. To address this, Information Retrieval (IR) techniques are increasingly being used to suggest potential buggy source code locations, for given bug reports. While IR techniques are very scalable, in practice their effectiveness in accurately localizing bugs in a software system remains low. Results of empirical studies suggest that the effectiveness of bug localization techniques can be augmented by the configuration of queries used to locate buggy code. However, in most IR-based bug localization techniques, presented by researchers, the impact of the queries' configurations is not fully considered. In a similar vein, techniques consider all code elements as equally suspicious of being buggy while localizing bugs, but this is not always the case either.In this paper, we present a new method-level, information-retrieval-based bug localization technique called ``BoostNSift''. BoostNSift exploits the important information in queries by `boost'ing that information, and then `sift's the identified code elements, based on a novel technique that emphasizes the code elements' specific relatedness to a bug report over its generic relatedness to all bug reports. To evaluate the performance of BoostNSift, we employed a state-of-the-art empirical design that has been commonly used for evaluating file level IR-based bug localization techniques: 6851 bugs are selected from commonly used Eclipse, AspectJ, SWT, and ZXing benchmarks and made openly available for method-level analyses.


翻译:处理大型系统时, 定位错误是一项重要但需要大量精力和费时的任务。 要解决这个问题, 正在越来越多地使用信息回收(IR) 技术来建议潜在的错误源代码位置, 用于给给给的错误报告 。 虽然IR 技术非常可缩放, 实际上它们在软件系统中准确定位错误的有效性仍然很低。 实验研究的结果表明, 错误本地化技术的效用可以通过用于定位错误代码的查询配置来增强。 然而, 在研究人员介绍的多数基于 IR 的错误本地化技术中, 查询配置的影响没有得到充分考虑。 类似地, 技术认为所有代码元素在对错误进行本地化时同样怀疑, 但情况也不总是如此。 在本文中, 我们展示了一个新的方法级别, 信息检索基于错误本地化技术的本地化技术( I) 。 以 Bustnift 为基础, 在查询中, 以“ 启动该信息”, 然后“ 发送错误化” 配置配置配置配置配置配置配置配置配置配置配置配置配置程序的影响没有得到充分考虑。

0
下载
关闭预览

相关内容

程序猿的天敌 有时是一个不能碰的magic
【干货书】机器学习算法视角,249页pdf
专知会员服务
144+阅读 · 2021年10月18日
最新《深度学习理论》笔记,68页pdf
专知会员服务
50+阅读 · 2021年2月14日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
86+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
80+阅读 · 2020年7月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
强化学习最新教程,17页pdf
专知会员服务
181+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
195+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
已删除
inpluslab
8+阅读 · 2019年10月29日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Arxiv
12+阅读 · 2021年6月21日
Arxiv
24+阅读 · 2020年3月11日
Deep Learning for Generic Object Detection: A Survey
Arxiv
14+阅读 · 2018年9月6日
VIP会员
相关VIP内容
【干货书】机器学习算法视角,249页pdf
专知会员服务
144+阅读 · 2021年10月18日
最新《深度学习理论》笔记,68页pdf
专知会员服务
50+阅读 · 2021年2月14日
最新《深度持续学习》综述论文,32页pdf
专知会员服务
86+阅读 · 2020年9月6日
Linux导论,Introduction to Linux,96页ppt
专知会员服务
80+阅读 · 2020年7月26日
【快讯】CVPR2020结果出炉,1470篇上榜, 你的paper中了吗?
强化学习最新教程,17页pdf
专知会员服务
181+阅读 · 2019年10月11日
【新书】Python编程基础,669页pdf
专知会员服务
195+阅读 · 2019年10月10日
机器学习入门的经验与建议
专知会员服务
94+阅读 · 2019年10月10日
相关资讯
已删除
inpluslab
8+阅读 · 2019年10月29日
Hierarchically Structured Meta-learning
CreateAMind
27+阅读 · 2019年5月22日
Unsupervised Learning via Meta-Learning
CreateAMind
42+阅读 · 2019年1月3日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
17+阅读 · 2018年12月24日
Disentangled的假设的探讨
CreateAMind
9+阅读 · 2018年12月10日
条件GAN重大改进!cGANs with Projection Discriminator
CreateAMind
8+阅读 · 2018年2月7日
【推荐】ResNet, AlexNet, VGG, Inception:各种卷积网络架构的理解
机器学习研究会
20+阅读 · 2017年12月17日
可解释的CNN
CreateAMind
17+阅读 · 2017年10月5日
【推荐】图像分类必读开创性论文汇总
机器学习研究会
14+阅读 · 2017年8月15日
Top
微信扫码咨询专知VIP会员