数据集概述
本数据集为AttackER网络攻击归因NER数据集,包含8个文件,涵盖JSON格式和spacy格式的训练、测试、验证数据,以及预训练模型压缩包和模型运行脚本。数据支持使用spaCy或Huggingface transformers框架训练网络攻击归因领域的NER模型,适用于网络安全场景下的实体识别任务。
文件详解
- 数据文件(JSON格式)
- 文件名称:train.json、test.json、dev.json
- 文件格式:JSON
- 字段映射介绍:用于Huggingface transformers框架训练NER模型的标注数据,包含训练、测试、验证集
- 数据文件(spacy格式)
- 文件名称:train.spacy、test.spacy、dev.spacy
- 文件格式:.spacy
- 字段映射介绍:用于spaCy框架训练NER模型的标注数据,与JSON文件对应训练、测试、验证集
- 模型文件
- 文件名称:new_model.zip
- 文件格式:ZIP
- 字段映射介绍:使用.spacy文件微调后的transformer模型压缩包,可用于网络攻击归因NER任务
- 脚本文件
- 文件名称:spacy_run_script.ipynb
- 文件格式:IPYNB
- 字段映射介绍:包含查看.spacy文件内容及运行new_model.zip模型的代码与操作指南
适用场景
- 网络安全NER模型训练: 利用JSON或spacy格式数据训练针对网络攻击归因领域的实体识别模型
- 攻击归因实体识别: 使用预训练模型new_model.zip实现网络攻击相关实体的自动识别与归因
- NLP框架适配验证: 对比spaCy与Huggingface transformers框架在网络安全NER任务中的训练效果
- 模型部署流程测试: 通过spacy_run_script.ipynb验证模型从训练到推理的完整流程可行性