Monitoring issue tracker submissions is a crucial software maintenance activity. A key goal is the prioritization of high risk, security-related bugs. If such bugs can be recognized early, the risk of propagation to dependent products and endangerment of stakeholder benefits can be mitigated. To assist triage engineers with this task, several automatic detection techniques, from Machine Learning (ML) models to prompting Large Language Models (LLMs), have been proposed. Although promising to some extent, prior techniques often memorize lexical cues as decision shortcuts, yielding low detection rate specifically for more complex submissions. As such, these classifiers do not yet reach the practical expectations of a real-time detector of security-related issues. To address these limitations, we propose SEBERTIS, a framework to train Deep Neural Networks (DNNs) as classifiers independent of lexical cues, so that they can confidently detect fully unseen security-related issues. SEBERTIS capitalizes on fine-tuning bidirectional transformer architectures as Masked Language Models (MLMs) on a series of semantically equivalent vocabulary to prediction labels (which we call Semantic Surrogates) when they have been replaced with a mask. Our SEBERTIS-trained classifier achieves a 0.9880 F1-score in detecting security-related issues of a curated corpus of 10,000 GitHub issue reports, substantially outperforming state-of-the-art issue classifiers, with 14.44%-96.98%, 15.40%-93.07%, and 14.90%-94.72% higher detection precision, recall, and F1-score over ML-based baselines. Our classifier also substantially surpasses LLM baselines, with an improvement of 23.20%-63.71%, 36.68%-85.63%, and 39.49%-74.53% for precision, recall, and F1-score.


翻译:监控议题跟踪系统的提交是软件维护中的一项关键活动。其主要目标在于优先处理高风险、与安全相关的缺陷。若能及早识别此类缺陷,便可降低其传播至依赖产品并危及利益相关者权益的风险。为协助分类工程师完成此任务,已有多种自动检测技术被提出,涵盖从机器学习(ML)模型到提示大型语言模型(LLMs)的方法。尽管现有技术在一定程度上展现出潜力,但它们往往将词汇线索作为决策捷径进行记忆,导致对更复杂提交的检测率较低。因此,这些分类器尚未达到实时检测安全相关议题的实际预期。为应对这些局限,我们提出了SEBERTIS框架,用于训练深度神经网络(DNNs)作为独立于词汇线索的分类器,使其能够可靠地检测完全未见过的安全相关议题。SEBERTIS的核心在于对双向Transformer架构进行微调,使其作为掩码语言模型(MLMs),在一系列与预测标签语义等效的词汇(我们称之为语义替代词)被掩码替换时进行学习。我们基于SEBERTIS训练的分类器在检测一个包含10,000份GitHub议题报告的精选语料库时,达到了0.9880的F1分数,显著优于当前最先进的议题分类器。与基于机器学习的基线相比,其检测精确率、召回率和F1分数分别高出14.44%-96.98%、15.40%-93.07%和14.90%-94.72%。同时,该分类器也大幅超越了LLM基线,在精确率、召回率和F1分数上分别实现了23.20%-63.71%、36.68%-85.63%和39.49%-74.53%的提升。

0
下载
关闭预览

相关内容

分类是数据挖掘的一种非常重要的方法。分类的概念是在已有数据的基础上学会一个分类函数或构造出一个分类模型(即我们通常所说的分类器(Classifier))。该函数或模型能够把数据库中的数据纪录映射到给定类别中的某一个,从而可以应用于数据预测。总之,分类器是数据挖掘中对样本进行分类的方法的统称,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。
PlanGenLLMs:大型语言模型规划能力的最新综述
专知会员服务
32+阅读 · 5月18日
LibRec 每周算法:LDA主题模型
LibRec智能推荐
29+阅读 · 2017年12月4日
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
VIP会员
相关基金
国家自然科学基金
17+阅读 · 2017年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
46+阅读 · 2015年12月31日
国家自然科学基金
0+阅读 · 2015年12月31日
国家自然科学基金
3+阅读 · 2015年12月31日
Top
微信扫码咨询专知VIP会员