Software reuse, especially partial reuse, poses legal and security threats to software development. Since its source codes are usually unavailable, software reuse is hard to be detected with interpretation. On the other hand, current approaches suffer from poor detection accuracy and efficiency, far from satisfying practical demands. To tackle these problems, in this paper, we propose \textit{ISRD}, an interpretation-enabled software reuse detection approach based on a multi-level birthmark model that contains function level, basic block level, and instruction level. To overcome obfuscation caused by cross-compilation, we represent function semantics with Minimum Branch Path (MBP) and perform normalization to extract core semantics of instructions. For efficiently detecting reused functions, a process for "intent search based on anchor recognition" is designed to speed up reuse detection. It uses strict instruction match and identical library call invocation check to find anchor functions (in short anchors) and then traverses neighbors of the anchors to explore potentially matched function pairs. Extensive experiments based on two real-world binary datasets reveal that \textit{ISRD} is interpretable, effective, and efficient, which achieves $97.2\%$ precision and $94.8\%$ recall. Moreover, it is resilient to cross-compilation, outperforming state-of-the-art approaches.


翻译:软件的再利用,特别是部分再利用,对软件开发构成法律和安全威胁。由于软件源代码通常不可用,因此很难用口译探测到软件再利用。另一方面,目前的方法由于检测准确性和效率差,远远不能满足实际需求。为了解决这些问题,我们在本文件中提议采用“textit{ISRD}”,一个基于多级胎记模型的解释辅助软件再利用检测方法,该模型包含功能水平、基本块级水平和教学水平。要克服交叉合成造成的混淆,我们代表最小分支路径(MBP)的功能语义,并进行常规化以提取指令的核心语义。为了高效地探测再利用功能,“基于锁定识别的意向搜索”程序旨在加速再利用探测。它使用严格的教学匹配和相同的图书馆访问来查找锚功能(在短锚上),然后让锚的邻居探索可能匹配的功能配对。基于两个真实世界双数据集的大规模实验显示,\ textititit {ISRD4) 是可解释的、有效性和高效率的方法。

0
下载
关闭预览

相关内容

【边缘智能综述论文】A Survey on Edge Intelligence
专知会员服务
115+阅读 · 2020年3月30日
专知会员服务
59+阅读 · 2020年3月19日
强化学习最新教程,17页pdf
专知会员服务
171+阅读 · 2019年10月11日
【SIGGRAPH2019】TensorFlow 2.0深度学习计算机图形学应用
专知会员服务
39+阅读 · 2019年10月9日
详解目标检测(MMdetection)-HOOK机制
极市平台
9+阅读 · 2020年9月22日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
LGA-RCNN: Loss-Guided Attention for Object Detection
Arxiv
1+阅读 · 2021年5月12日
Arxiv
0+阅读 · 2021年5月6日
Revealing the Dark Secrets of BERT
Arxiv
4+阅读 · 2019年9月11日
VIP会员
相关资讯
详解目标检测(MMdetection)-HOOK机制
极市平台
9+阅读 · 2020年9月22日
Hierarchically Structured Meta-learning
CreateAMind
23+阅读 · 2019年5月22日
强化学习的Unsupervised Meta-Learning
CreateAMind
17+阅读 · 2019年1月7日
meta learning 17年:MAML SNAIL
CreateAMind
11+阅读 · 2019年1月2日
《pyramid Attention Network for Semantic Segmentation》
统计学习与视觉计算组
44+阅读 · 2018年8月30日
Single-Shot Object Detection with Enriched Semantics
统计学习与视觉计算组
14+阅读 · 2018年8月29日
论文笔记之Feature Selective Networks for Object Detection
统计学习与视觉计算组
21+阅读 · 2018年7月26日
分布式TensorFlow入门指南
机器学习研究会
4+阅读 · 2017年11月28日
[DLdigest-8] 每日一道算法
深度学习每日摘要
4+阅读 · 2017年11月2日
Top
微信扫码咨询专知VIP会员