Worm origin identification and propagation path reconstruction are among the essential problems in digital forensics. Until now, several methods have been proposed for this purpose. However, evaluating these methods is a big challenge because there are no suitable datasets containing both normal background traffic and worm traffic to evaluate these methods. In this paper, we investigate different methods of generating such datasets and suggest a technique for this purpose. ReaSE is a tool for the creation of realistic simulation environments. However, it needs some modifications to be suitable for generating the datasets. So we make required modifications to it. Then, we generate several datasets for Slammer, Code Red I, Code Red II and modified versions of these worms in different scenarios using our technique and make them publicly available.


翻译:虫源的识别和传播路径的重建是数字法证中的基本问题之一。 到目前为止,已经为此提出了几种方法。 但是,评估这些方法是一个巨大的挑战,因为没有包含正常背景流量和蠕虫流量的适当数据集来评估这些方法。 在本文中,我们调查了生成这种数据集的不同方法,并为此目的提出一种技术。 ReaSE是创造现实模拟环境的工具。然而,它需要作一些修改,以适合生成数据集。因此,我们对此做了必要的修改。然后,我们利用我们的技术,为Slamer、Red I、Red II和不同情况下的这些虫子的修改版本制作了数套数据集,并公布这些数据集。

0
下载
关闭预览

相关内容

数据集,又称为资料集、数据集合或资料集合,是一种由数据所组成的集合。
Data set(或dataset)是一个数据的集合,通常以表格形式出现。每一列代表一个特定变量。每一行都对应于某一成员的数据集的问题。它列出的价值观为每一个变量,如身高和体重的一个物体或价值的随机数。每个数值被称为数据资料。对应于行数,该数据集的数据可能包括一个或多个成员。
专知会员服务
38+阅读 · 2020年11月24日
【ICML2020】文本摘要生成模型PEGASUS
专知会员服务
35+阅读 · 2020年8月23日
商业数据分析,39页ppt
专知会员服务
161+阅读 · 2020年6月2日
Gartner:2020年十大战略性技术趋势, 47页pdf
专知会员服务
78+阅读 · 2020年3月10日
【大规模数据系统,552页ppt】Large-scale Data Systems
专知会员服务
61+阅读 · 2019年12月21日
[综述]深度学习下的场景文本检测与识别
专知会员服务
78+阅读 · 2019年10月10日
已删除
将门创投
13+阅读 · 2019年4月17日
Arxiv
1+阅读 · 2021年7月16日
Arxiv
5+阅读 · 2020年10月14日
Generative Adversarial Networks: A Survey and Taxonomy
Adversarial Transfer Learning
Arxiv
12+阅读 · 2018年12月6日
VIP会员
相关资讯
已删除
将门创投
13+阅读 · 2019年4月17日
Top
微信扫码咨询专知VIP会员