网络安全相关数据集介绍与下载
目录
1、KDD99 入侵检测数据集
该数据集是从一个模拟的美国空军局域网上采集来的9个星期的网络连接数据,分成具有标识的训练数据和未加标识的测试数据。测试数据和训练数据有着不同的概率分布,测试数据包含了一些未出现在训练数据中的攻击类型,这使得入侵检测更具有现实性。在训练数据集中包含了1种正常的标识类型normal和22种训练攻击类型,另外有14种攻击仅出现在测试数据集中。
2、NSL KDD 入侵检测数据集
NSL-KDD数据集解决了KDD99数据集中存在的固有问题。NSL-KDD数据集由于缺少基于入侵检测网络的公共数据集,所以NSL-KDD数据集仍然存在一些问题,同时也不是现有真实网络的完美代表。但它仍然可以用作有效的基准数据集,以帮助研究人员比较不同的入侵检测方法。NSL-KDD训练集和测试集的设置是合理的,不同研究工作的评估结果将是一致的和可比的。
3、UNSW_NB15 入侵检测数据集
4、NASA MDP 软件缺陷数据集
软件缺陷预测研究中心广泛应用的由美国航空航天局(NASA)公布的NASA IV&V Facility Metrics Data Program(MDP)数据集,MDP 是一个开放的数据仓库,数据集的开放性方便了不同的研究者进行实验的重复、改进甚至反驳。 MDP包括 13个不同的数据集,这些数据均来自NASA 的13个实际软件项目,由最常见的开发语言编写。每个数据集包含来自不同软件项目的若干模块,规模从 125个模块到 17186 个模块不等。各个数据集由LOC、McCabe、Halstead等几类度量元属性和是否包含缺陷的类别标记(defective)组成。MDP数据集所提供的记录,一行代表一个模块,每个字段对应一个属性。
NASA MDP 软件缺陷数据集统计规模如下表:
数据集 | 开发语言 | 模块总数 | 缺陷模块数 | 属性个数 | 缺陷模块所占比例(%) |
CM1 | C | 505 | 48 | 38 | 9.50 |
JM1 | C | 10878 | 2102 | 22 | 19.32 |
KC1 | C++ | 2017 | 325 | 22 | 16.11 |
KC3 | Java | 458 | 43 | 40 | 9.39 |
KC4 | Perl | 125 | 61 | 15 | 48.80 |
MC1 | C++ | 9466 | 68 | 39 | 0.72 |
MC2 | C | 161 | 52 | 38 | 32.30 |
MW1 | C | 403 | 31 | 38 | 7.70 |
PC1 | C | 1031 | 76 | 37 | 7.37 |
PC2 | C | 5589 | 23 | 37 | 0.41 |
PC3 | C | 1563 | 160 | 38 | 10.24 |
PC4 | C | 1458 | 178 | 38 | 12.21 |
PC5 | C++ | 17186 | 516 | 39 | 3.00 |
5、CNNVD 软件安全漏洞数据集
CNNVD是中国信息安全漏洞数据库(China National Vulnerability Database of Information Security,CNNVD)
6、NVD 软件安全漏洞数据集
NVD是美国国家计算机通用漏洞数据库(National Vulnerability Database,NVD)