会员服务 ·

灭霸来了！微软发布BugLab：无需标注，GAN掉bug

2021 年 12 月 23 日 新智元

新智元报道

编辑：LRS

【新智元导读】程序员的死对头就是各种bug！最近微软在NeurIPS 2021上带来了一个好消息，研究人员设计了一个类似GAN的网络，通过选择器和检测器来互相写和改bug，而且还不需要标注数据！

常言道，「一杯茶，一包烟，一个bug改一天」。

写代码是软件工程师们每天的工作，但当你辛辛苦苦写了一大堆代码，却发现无法运行的时候，内心一定是崩溃的。

找bug不仅费时费力，最关键的是还经常找不着，并且有时候改了一个bug又会引入更多bug，子子孙孙无穷尽也。

简直就是找bug找到吐血。

随着AI技术的发展，各大公司开发的代码助手如GitHub Copilot等也能帮你少写一些有bug的代码。

但这还远远不够！

深度学习要是能帮我把代码里的bug也给修了，我上班只负责摸鱼，岂不是美滋滋！

微软在NeurIPS 2021上还真发了一篇这样的论文，其中提出了一个新的深度学习模型BugLab，并通过自监督的学习方法，可以在不借助任何标注数据的情况下检测和修复代码中的bug，堪称程序员的救世主！

https://arxiv.org/pdf/2105.12787.pdf

修bug难在哪？

所谓的bug，就是代码的实际运行和自己的预期不符。

该运行的没运行，该输出a，结果却输出个b，这种代码故意找茬的行为都属于bug。

所以想要找到并修复代码中的bug，不仅需要对代码的结构进行推理，还需要理解软件开发者在代码注释、变量名称等方面留下的模糊的自然语言提示。

例如一段程序的意图是，如果名字的长度超过了22个字符，那就只截取前22个。但原始代码中错误地把大于号写成了小于号，导致条件判断错误，程序运行结果和预期不符。

这种小错误在写代码的过程也是太常见了，稍不注意就会把条件弄反。

还有一种bug就是使用了错误的变量，例如下面的例子里面write和read弄错了，就会导致条件判断失败，这种bug的修复只有在理解了变量名的意义后才能修复，传统的修复手段对此是无能为力。

这种错误看起来很简单，但往往盯着看代码的时候却很难发现，属于一改改一天的那种。

并且每个程序员有自己的编程风格，比如不同的命名、缩进、判断以及重构的方式，想让代码来给自己找bug，一个字，难！

对于微软来说，好在有GitHub代码库可以用来训练模型。但问题来了，GitHub上带bug的代码有那么多吗？有bug谁还commit啊？就算能找到代码，也没人来标注数据啊！

微软提出的BugLab使用了两个相互竞争的模型，通过玩躲猫猫（hide and seek）游戏来学习，主要的灵感来源就是生成对抗网络（GAN）。

由于有大量的代码实际上都是没有bug的，所以需要设计一个bug selector来决定是否修改正确的代码来引入一个bug，以及以何种方式引入bug（例如把减号改为加号等）。当选择器确定了bug的类别后，就通过编辑源代码的方式引入bug。

另一个用来对抗的是bug detector，用来判断一段代码是否存在bug，如果存在的话，它需要定位并修复这个bug。

选择器和检测器都能够在没有标记数据的情况下共同训练，也就是说整个训练过程都是以自监督的方式进行，并成功在数百万个代码片段上训练。

selector负责写bug，并把它藏（hide）起来，而detector负责找bug，并修复，整个过程就像躲猫猫一样。

随着训练的进行，selector写bug越来越熟练，而detector也能够应对更复杂的bug。

整个过程与GAN的训练大体相似，但目的却大不相同。GAN的目的是获得一个更好的生成器来修改图片，但BugLab的目的是找到一个更好的检测器（GAN中的判别器）。

并且整个训练也可以看作是一个teacher-student模型，选择器教会检测器如何定位并修复bug。

为开源社区修bug！

虽然从理论上来说，使用这种hide and seek的方式可以训练更复杂的selector来生成更多样的bug，从而detector的修bug能力也会更强。

但以目前的AI发展水平来说，还无法教会selector写更难的bug。

所以研究人员表示，我们需要集中精力关注那些更经常犯的错误，包括不正确的比较符，或者不正确的布尔运算符，错误的变量名引用等等其他一些简单的bug。并且为了简单起见，实验中只针对python代码进行研究训练。

虽然这些解释听起来都像是借口。

为了衡量模型的性能，研究人员从Python包索引中手动注释了一个小型bug数据集，和其他替代方案（例如随机插入bug的selector）相比，使用hide and seek方法训练的模型性能最多可以提高30%

并且实验表明大约26%的bug都可以被发现并自动修复。在检测器发现的bug中，有19个在现实生活中的开源GitHub代码中都属于是未知的bug。

但模型也会对正确的代码报告存在bug，所以这个模型在离实际部署上线还有一段距离。

如果更深入地研究selector和detector模型的话，就会引出那个老生常谈的问题：深度学习模型到底有没有，又怎么样去「理解」一段代码的作用？

过去的研究表明，将代码表示为一个token序列就能够产生次优的（suboptimal）效果。

但如果想要利用代码中的结构，例如语法、数据、控制流等等，就需要将代码中的语法节点、表达式、标识符、符号等等都表示为一个图上的节点，并用边来表示节点间的关系。

有了图以后就可以使用神经网络来训练detector和selector了。研究人员使用图神经网络（GNN）和relational transformer都进行了实验，结果发现GNN总体上优于relational transformer。

如何让AI帮助人类来写代码和改bug一直都是人工智能研究中的一项基础任务，任务过程中AI模型需要理解人类对程序代码、变量名称和注释提供的上下文线索来理解代码的意图。

虽然BugLab离真正解放程序员改bug还很遥远，但距离我们消灭bug总算又向前走了一步！

参考资料：

https://www.microsoft.com/en-us/research/blog/finding-and-fixing-bugs-with-deep-learning/

登录查看更多

相关内容

Bug

关注 7

程序猿的天敌有时是一个不能碰的magic

李飞飞斯坦福经典CS231N课程2022季开课了！斯坦福《深度学习计算机视觉》》开始了！不容错过！

专知会员服务

160+阅读 · 2022年3月30日

【Hugging Face】指导文本生成与约束波束搜索🤗Transformers，Guiding Text Generation with Constrained Beam Search in 🤗 Transformers

专知会员服务

22+阅读 · 2022年3月18日

【AAAI 2022】299页PPT，NUS最全《自动合成》教程

专知会员服务

20+阅读 · 2022年3月17日

【AAAI 2022】基于数据分布生成的可预测概念漂移适应

专知会员服务

34+阅读 · 2022年1月12日

基于深度神经网络的高效视觉识别研究进展与新方向

专知会员服务

39+阅读 · 2021年8月31日

ICCV'21 Oral｜拒绝调参，显著提点！检测分割任务的新损失函数RS Loss开源

专知会员服务

16+阅读 · 2021年8月11日

【CVPR2021】GAN人脸预训练模型

专知会员服务

24+阅读 · 2021年4月10日

CVPR 2021｜无需干净图像的自监督图像降噪

专知会员服务

39+阅读 · 2021年3月29日

新杀器来了！Facebook AI提出DETR：用Transformers来进行端到端的目标检测

专知会员服务

51+阅读 · 2020年5月28日

完整版！《GAN实战：生成对抗网络深度学习》在线书与代码，牛津大学Jakub著作 (附下载)

专知会员服务

354+阅读 · 2019年12月25日

AlphaCode能替代人类程序员吗？网友：被替代也挺好，这样就可以少写代码多开会了

AI前线

0+阅读 · 2022年3月30日

改代码超级快！GPT-3新增编辑与插入文本功能，AI能为你写诗了

新智元

0+阅读 · 2022年3月22日

AAAI 2022 Oral | 无需人工标注，清华、快手提出基于参考图像的单张生成图像质量评价方法

机器之心

2+阅读 · 2022年2月24日

CSDN

0+阅读 · 2021年12月28日

找bug神器！不执行代码就可以找PyTorch模型错误！

CVer

0+阅读 · 2021年12月24日

谷歌让NLP模型也能debug，只要给一张「草稿纸」就行

量子位

0+阅读 · 2021年12月4日

我用Transformer修复代码bug

夕小瑶的卖萌屋

1+阅读 · 2021年9月9日

【学界】造假AI又进化！只要一张照片，说话唱歌视频自动生成，降维打击Deepfakes丨已开源

GAN生成式对抗网络

12+阅读 · 2019年6月24日

GAN零基础入门：从伪造视频到生成假脸

新智元

13+阅读 · 2019年6月18日

深度图像先验：无需学习即可生成新图像

论智

45+阅读 · 2017年12月4日

基于多样化查询的多标记主动学习研究

国家自然科学基金

0+阅读 · 2015年12月31日

面向互联网图像视频的鲁棒人脸分析与识别技术研究

国家自然科学基金

1+阅读 · 2014年12月31日

不完全数据下分位数回归模型的经验似然推断

国家自然科学基金

1+阅读 · 2013年12月31日

人脸图像的身份和表情同步识别方法研究

国家自然科学基金

2+阅读 · 2012年12月31日

含有缺失值的纵向数据回归模型的稳健推断

国家自然科学基金

3+阅读 · 2012年12月31日

基于正则Vine copula的相依建模及软件开发

国家自然科学基金

0+阅读 · 2012年12月31日

基于API的静态插桩技术与Android平台恶意代码检测

国家自然科学基金

0+阅读 · 2012年12月31日

超精度视频内容三维重建

国家自然科学基金

0+阅读 · 2011年12月31日

面向网络弱标记图像的视觉对象模型在线学习方法

国家自然科学基金

0+阅读 · 2011年12月31日

面向量子操控的量子系统辨识方法研究

国家自然科学基金

0+阅读 · 2009年12月31日

BugListener: Identifying and Synthesizing Bug Reports from Collaborative Live Chats

Arxiv

0+阅读 · 2022年4月20日

Dual-Domain Image Synthesis using Segmentation-Guided GAN

Arxiv

0+阅读 · 2022年4月19日

Understanding Toxicity Triggers on Reddit in the Context of Singapore

Arxiv

0+阅读 · 2022年4月19日

Synthesizing Informative Training Samples with GAN

Arxiv

0+阅读 · 2022年4月15日

Exemplar-based Pattern Synthesis with Implicit Periodic Field Network

Arxiv

0+阅读 · 2022年4月15日

Investigation of condominium building collapse in Surfside, Florida: A video feature tracking approach

Arxiv

0+阅读 · 2022年4月14日

Multiplier with Reduced Activities and Minimized Interconnect for Inner Product Arrays

Arxiv

0+阅读 · 2022年4月11日

A Mathematical Introduction to Generative Adversarial Nets (GAN)

Arxiv

28+阅读 · 2020年9月1日

CapsuleGAN: Generative Adversarial Capsule Network

Arxiv

10+阅读 · 2018年2月17日

Exploring Models and Data for Remote Sensing Image Caption Generation

Arxiv

14+阅读 · 2017年12月21日

VIP会员