《用于代码弱点识别的 LLVM 中间表示》CMU - 专知VIP

会员服务 ·

6

AI与军事 · 代码弱点 · 机器学习 · 中间表示 · CMU ·

2022 年 12 月 12 日

《用于代码弱点识别的 LLVM 中间表示》CMU

专知会员服务

专知，提供专业可信的知识分发服务，让认知协作更快更好！

最近在代码弱点识别方面的努力，除了抽象语法树等更多的结构性特征外，还注重在源代码文本上训练统计机器学习（ML）模型，作为特征空间。LLVM中间表示法（IR）可以通过标准化代码、减少词汇量以及消除关于语法和内存的一些上下文敏感性来帮助ML模型。我们研究了LLVM IR对训练统计和机器学习模型的好处，包括词包模型、BiLSTM和一些品种的转换模型。我们将这些基于LLVM IR的模型与基于源代码C的模型在两组不同的数据上进行了比较：合成数据和更自然的数据。我们发现，虽然使用LLVM IR特征并不能产生比基于C语言的模型更准确的模型，但我们能够识别出上下文特定的LLVM IR和C语言标记，这些标记有助于表明存在的弱点。此外，对于一个给定的数据集，我们发现在使用更复杂、更耗时的模型之前，任何统计或ML模型是否有利于代码弱点的识别，词包模型可以成为强有力的指标。

成为VIP会员查看完整内容

14

相关内容

AI与军事

人工智能在军事中可用于多项任务，例如目标识别、大数据处理、作战系统、网络安全、后勤运输、战争医疗、威胁和安全监测以及战斗模拟和训练。

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

专知会员服务

35+阅读 · 2022年12月14日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

专知会员服务

22+阅读 · 2021年1月21日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

新智元

0+阅读 · 2022年10月26日

利用 OpenCV+ConvNets 检测几何图形

利用 OpenCV+ConvNets 检测几何图形

极市平台

0+阅读 · 2022年1月26日

开发人员如何正确地在产品中使用 GPT-3？

开发人员如何正确地在产品中使用 GPT-3？

InfoQ

2+阅读 · 2022年1月13日

开发人员如何正确地在产品中使用GPT-3？

开发人员如何正确地在产品中使用GPT-3？

AI前线

0+阅读 · 2022年1月12日

用于研究翻译中性别偏见的数据集

用于研究翻译中性别偏见的数据集

TensorFlow

0+阅读 · 2021年8月19日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

24+阅读 · 2020年12月30日

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

专知

38+阅读 · 2020年7月29日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知

58+阅读 · 2020年3月11日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

教程帖：用TensorFlow自制Taylor Swift识别器

教程帖：用TensorFlow自制Taylor Swift识别器

论智

13+阅读 · 2018年1月17日

基于反模式自动检测的代码质量分析与重构

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

视频时空兴趣点检测与描述的几何代数方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于核范数低秩表示的基因转录模块识别

国家自然科学基金

0+阅读 · 2013年12月31日

癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

癌症生物标记识别的基因网络研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于主题发现的图像语义理解与识别

国家自然科学基金

1+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

丛流形学习及其在物体识别中的应用

国家自然科学基金

0+阅读 · 2010年12月31日

转录因子AHA-1/AHR-1介导神经细胞特异识别的作用机制

国家自然科学基金

0+阅读 · 2009年12月31日

Predicting the cardinality of a reduced Gröbner basis

Arxiv

0+阅读 · 2023年2月10日

Short-Term Aggregated Residential Load Forecasting using BiLSTM and CNN-BiLSTM

Arxiv

0+阅读 · 2023年2月10日

Explanation Selection Using Unlabeled Data for In-Context Learning

Explanation Selection Using Unlabeled Data for In-Context Learning

Arxiv

0+阅读 · 2023年2月9日

GFM: Building Geospatial Foundation Models via Continual Pretraining

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Fast Linear Model Trees by PILOT

Arxiv

0+阅读 · 2023年2月8日

VQA and Visual Reasoning: An Overview of Recent Datasets, Methods and Challenges

Arxiv

11+阅读 · 2022年12月26日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

Arxiv

25+阅读 · 2019年5月21日

VIP会员

相关主题

相关VIP内容

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

【CMU博士论文】无人工监督的视觉表示与识别，126页pdf

专知会员服务

35+阅读 · 2022年12月14日

【牛津大学博士论文】鲁棒神经网络:评估与构建

【牛津大学博士论文】鲁棒神经网络:评估与构建

专知会员服务

35+阅读 · 2022年10月23日

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

【CMU博士论文】缓解负迁移提高迁移学习的泛化和效率，201页pdf

专知会员服务

56+阅读 · 2022年4月19日

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

《用于胸部 X 射线自动肺部疾病分析的深度学习》汉堡科技大学博士论文

专知会员服务

35+阅读 · 2022年4月17日

【NeurIPS2021】用于视频分割的密集无监督学习

【NeurIPS2021】用于视频分割的密集无监督学习

专知会员服务

15+阅读 · 2021年11月14日

【Hinton新论文】语言建模目标检测Pix2seq

【Hinton新论文】语言建模目标检测Pix2seq

专知会员服务

26+阅读 · 2021年9月23日

【哥伦比亚大学博士论文】深度概率图建模147页pdf

【哥伦比亚大学博士论文】深度概率图建模147页pdf

专知会员服务

90+阅读 · 2021年4月27日

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

《深度潜变量模型的编码视角》博士论文，154页pdf阐述深度潜变量模型(DLVM)中的统计推理与编码的关系

专知会员服务

22+阅读 · 2021年1月21日

【牛津大学博士论文】解释深度神经网络，134页pdf

【牛津大学博士论文】解释深度神经网络，134页pdf

专知会员服务

220+阅读 · 2020年10月8日

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

【ACL2020】TriggerNER:使用实体触发器学习作为解释用于命名实体识别

专知会员服务

23+阅读 · 2020年4月18日

热门VIP内容

开通专知VIP会员享更多权益服务

操作系统智能体：基于多模态大模型（MLLM）的通用计算设备智能体综述

《美国太空军系统全生命周期建模、仿真与分析效能提升方案》最新84页报告

【博士论文】推进数据高效的深度学习：非参数 Transformer、主动测试与上下文学习

自主人工智能：未来战争是否将是自主化的？

相关资讯

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

训练ViT和MAE减少一半计算量！Sea和北大联合提出高效优化器Adan，深度模型都能用

新智元

0+阅读 · 2022年10月26日

利用 OpenCV+ConvNets 检测几何图形

利用 OpenCV+ConvNets 检测几何图形

极市平台

0+阅读 · 2022年1月26日

开发人员如何正确地在产品中使用 GPT-3？

开发人员如何正确地在产品中使用 GPT-3？

InfoQ

2+阅读 · 2022年1月13日

开发人员如何正确地在产品中使用GPT-3？

开发人员如何正确地在产品中使用GPT-3？

AI前线

0+阅读 · 2022年1月12日

用于研究翻译中性别偏见的数据集

用于研究翻译中性别偏见的数据集

TensorFlow

0+阅读 · 2021年8月19日

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

安利一个开源的好工具Label Studio, 闭环数据标注和模型训练

AINLP

24+阅读 · 2020年12月30日

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

图神经网络如何用于知识图谱？这篇《图神经网络知识图谱补全》综述论文帮你总结好了

专知

38+阅读 · 2020年7月29日

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

近期必读的5篇顶会WWW 2020【图神经网络（GNN）】相关论文-Part2

专知

58+阅读 · 2020年3月11日

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

CMU2018春季课程：神经网络自然语言处理课程（附PPT和代码）

专知

12+阅读 · 2018年2月2日

教程帖：用TensorFlow自制Taylor Swift识别器

教程帖：用TensorFlow自制Taylor Swift识别器

论智

13+阅读 · 2018年1月17日

相关基金

基于反模式自动检测的代码质量分析与重构

国家自然科学基金

0+阅读 · 2014年12月31日

维吾尔语命名实体间语义关系抽取理论方法研究

国家自然科学基金

1+阅读 · 2014年12月31日

视频时空兴趣点检测与描述的几何代数方法

国家自然科学基金

0+阅读 · 2013年12月31日

基于核范数低秩表示的基因转录模块识别

国家自然科学基金

0+阅读 · 2013年12月31日

癌症体细胞拷贝数变异功能模式的鉴定方法与应用研究

国家自然科学基金

0+阅读 · 2012年12月31日

癌症生物标记识别的基因网络研究

国家自然科学基金

1+阅读 · 2012年12月31日

基于主题发现的图像语义理解与识别

国家自然科学基金

1+阅读 · 2011年12月31日

基于半监督结构化学习的跨语言映射研究

国家自然科学基金

2+阅读 · 2011年12月31日

丛流形学习及其在物体识别中的应用

国家自然科学基金

0+阅读 · 2010年12月31日

转录因子AHA-1/AHR-1介导神经细胞特异识别的作用机制

国家自然科学基金

0+阅读 · 2009年12月31日

相关论文

Predicting the cardinality of a reduced Gröbner basis

Arxiv

0+阅读 · 2023年2月10日

Short-Term Aggregated Residential Load Forecasting using BiLSTM and CNN-BiLSTM

Arxiv

0+阅读 · 2023年2月10日

Explanation Selection Using Unlabeled Data for In-Context Learning

Explanation Selection Using Unlabeled Data for In-Context Learning

Arxiv

0+阅读 · 2023年2月9日

GFM: Building Geospatial Foundation Models via Continual Pretraining

Arxiv

0+阅读 · 2023年2月9日

Fast Parallel Degree+1 List Coloring

Arxiv

0+阅读 · 2023年2月8日

Fast Linear Model Trees by PILOT

Arxiv

0+阅读 · 2023年2月8日

VQA and Visual Reasoning: An Overview of Recent Datasets, Methods and Challenges

Arxiv

11+阅读 · 2022年12月26日

CSKG: The CommonSense Knowledge Graph

CSKG: The CommonSense Knowledge Graph

Arxiv

18+阅读 · 2020年12月21日

Pre-Training with Whole Word Masking for Chinese BERT

Arxiv

11+阅读 · 2019年6月19日

Estimating Node Importance in Knowledge Graphs Using Graph Neural Networks

Arxiv

25+阅读 · 2019年5月21日

微信扫码咨询专知VIP会员