数据集

网络犯罪文本分类数据集CybercrimeTextClassificationDataset-sriganesh459

数据来源：互联网公开数据

标签：网络犯罪, 文本分类, 犯罪信息, 自然语言处理, 机器学习, 数据标注, 信息安全, 恶意文本

数据概述：该数据集包含来自网络安全事件报告的数据，记录了各种网络犯罪的文本描述信息，用于网络犯罪的分类与分析。主要特征如下：时间跨度：数据未标明具体时间，可视为静态语料数据集使用。地理范围：数据覆盖范围未明确，但涉及在线金融欺诈、网络攻击等多种类型网络犯罪，可能源于全球范围内的网络安全事件。数据维度：包括“category”（犯罪类别）、“sub_category”（子类别）和“crimeaditionalinfo”（犯罪附加信息，即犯罪描述文本）字段。其中，filtered_dataset.csv文件额外包含“cleaned_text”字段。数据格式：CSV格式，包含 train.csv、test.csv和filtered_dataset.csv三个文件，便于文本处理和分类建模分析。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于网络安全、犯罪学与自然语言处理交叉领域的学术研究，如恶意文本检测、犯罪行为模式分析、情感分析等。行业应用：为信息安全行业提供数据支持，可用于构建入侵检测系统（IDS）、安全情报分析系统等，提高对网络犯罪的识别和预警能力。决策支持：支持执法部门的网络犯罪调查与情报分析，辅助制定网络安全策略，优化资源分配。教育和培训：作为网络安全、数据科学等课程的实训数据，用于学生训练模型、了解网络犯罪模式，培养分析能力。此数据集特别适合用于探索网络犯罪的文本特征与分类规律，帮助用户实现对网络犯罪的自动化识别与风险评估，提升网络安全防护水平。

数据与资源

versions_20250403083008.zipZIP
33.32 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	33.32 MiB
最后更新	2025年5月29日
创建于	2025年5月29日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

网络犯罪文本分类数据集CybercrimeTextClassificationDataset-sriganesh459

数据与资源

附加信息

注册成功！