网络钓鱼网站检测数据集PhishingWebsiteDetectionDataset-ruckdent

网络钓鱼网站检测数据集PhishingWebsiteDetectionDataset-ruckdent

数据来源:互联网公开数据

标签:网络安全, 钓鱼网站, URL分析, 机器学习, 恶意URL, 特征工程, 网站安全, 数据挖掘

数据概述: 该数据集包含多个CSV文件,整合了来自网络安全社区和公开数据集的URL数据,旨在用于网络钓鱼网站的检测与识别。主要特征如下: 时间跨度:数据未明确标注时间范围,可视为静态数据集,反映了特定时期的网络钓鱼网站特征。 地理范围:数据涵盖全球范围内的网络钓鱼网站及相关URL,代表了不同地域的网络钓鱼活动。 数据维度:数据集包含多个CSV文件,其中: phishing_site_urls.csv:包含URL和标签(0表示正常网站,1表示钓鱼网站)。 malicious_phish.csv:包含URL和网站类型信息。 Phishing_dataset_01.csv:包含多种URL特征,如IP地址使用、URL长度、SSL状态、域名注册时长等,以及一个“Result”字段,指示该URL是否为钓鱼网站。 Phishing_dataset_03.csv:包含URL、域名、目录、文件和参数中各种字符的数量统计,以及URL长度等特征。 Phishing_dataset_02.csv和Phishing_dataset_04.csv:包含类似Phishing_dataset_01.csv的URL特征和结果标签。 数据格式:数据以CSV格式提供,方便数据读取、处理和分析。 来源信息:数据来源于网络安全研究、公开数据集等,经过整理和标注,可用于模型训练和评估。 该数据集适合用于网络钓鱼网站检测、恶意URL识别、安全威胁情报分析等领域的研究和应用。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于网络安全、机器学习、数据挖掘等领域的研究,例如URL特征分析、钓鱼网站检测模型的构建与评估。 行业应用:为安全行业提供数据支持,可用于构建钓鱼网站检测系统、安全情报分析平台,提升网络安全防护能力。 决策支持:支持安全决策,帮助企业和个人识别和防范钓鱼网站攻击,降低安全风险。 教育和培训:作为网络安全、机器学习等课程的实训材料,帮助学生和研究人员理解钓鱼网站的特征,并进行模型训练和实验。 此数据集特别适合用于探索URL特征与钓鱼网站之间的关联,构建高效的钓鱼网站检测模型,从而提升网络安全防护水平。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 32.34 MiB
最后更新 2025年5月20日
创建于 2025年5月20日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。