When developers investigate a new bug report, they search for similar previously fixed bug reports and discussion threads attached to them. These discussion threads convey important information about the behavior of the bug including relevant bug-fixing comments. Oftentimes, these discussion threads become extensively lengthy due to the severity of the reported bug. This adds another layer of complexity, especially if relevant bug-fixing comments intermingle with seemingly unrelated comments. To manually detect these relevant comments among various cross-cutting discussion threads can become a daunting task when dealing with high volume of bug reports. To automate this process, our focus is to initially extract and detect comments in the context of query relevance, the use of positive language, and semantic relevance. Then, we merge these comments in the form of a summary for easy understanding. Specifically, we combine Sentiment Analysis and the TextRank Model with the baseline Vector Space Model (VSM). Preliminary findings indicate that bug-fixing comments tend to be positive and there exists a semantic relevance with comments from other cross-cutting discussion threads. The results also indicate that our combined approach improves overall ranking performance against the baseline VSM.


翻译:当开发者调查新的错误报告时,他们会搜索类似的先前固定的错误报告和与之相关的讨论线索。 这些讨论线索传递关于错误行为的重要信息, 包括相关的错误修正评论。 通常, 这些讨论线索会由于报告错误的严重性而变得非常冗长。 这增加了另一个复杂层面, 特别是如果相关的错误修正评论与似乎无关的评论混杂在一起。 要手动在各种交叉讨论线索中发现这些相关评论, 处理大量错误报告时会成为一个艰巨的任务 。 要将这一过程自动化, 我们的重点是在查询相关性、 使用正面语言和语义相关性的背景下, 提取和检测这些评论。 然后, 我们将这些评论以摘要的形式合并起来, 以便于理解 。 具体地说, 我们把传感器分析与TextRank 模型和基线矢量空间模型( VSM) 结合起来。 初步发现, 错误修正意见往往是肯定的, 并且与其他交叉讨论线索的评论存在语义相关性。 结果还表明, 我们的综合方法提高了基线VSM的总体排序性。

0
下载
关闭预览

相关内容

程序猿的天敌 有时是一个不能碰的magic
专知会员服务
123+阅读 · 2020年9月8日
抢鲜看!13篇CVPR2020论文链接/开源代码/解读
专知会员服务
49+阅读 · 2020年2月26日
机器学习入门的经验与建议
专知会员服务
90+阅读 · 2019年10月10日
最新BERT相关论文清单,BERT-related Papers
专知会员服务
52+阅读 · 2019年9月29日
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
【TED】生命中的每一年的智慧
英语演讲视频每日一推
9+阅读 · 2019年1月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
基于LSTM-CNN组合模型的Twitter情感分析(附代码)
机器学习研究会
50+阅读 · 2018年2月21日
【推荐】深度学习情感分析综述
机器学习研究会
58+阅读 · 2018年1月26日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
Arxiv
0+阅读 · 2021年7月15日
Arxiv
5+阅读 · 2019年8月22日
Arxiv
21+阅读 · 2019年3月25日
Arxiv
3+阅读 · 2018年12月18日
VIP会员
相关资讯
Transferring Knowledge across Learning Processes
CreateAMind
26+阅读 · 2019年5月18日
【TED】生命中的每一年的智慧
英语演讲视频每日一推
9+阅读 · 2019年1月29日
A Technical Overview of AI & ML in 2018 & Trends for 2019
待字闺中
16+阅读 · 2018年12月24日
基于LSTM-CNN组合模型的Twitter情感分析(附代码)
机器学习研究会
50+阅读 · 2018年2月21日
【推荐】深度学习情感分析综述
机器学习研究会
58+阅读 · 2018年1月26日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
【推荐】自然语言处理(NLP)指南
机器学习研究会
35+阅读 · 2017年11月17日
xgboost特征选择
数据挖掘入门与实战
39+阅读 · 2017年10月5日
Top
微信扫码咨询专知VIP会员