数据集

网络钓鱼网站检测数据集PhishingWebsiteDetectionDataset-ruckdent

数据来源：互联网公开数据

标签：网络安全, 钓鱼网站, URL分析, 机器学习, 恶意URL, 特征工程, 网站安全, 数据挖掘

数据概述：该数据集包含多个CSV文件，整合了来自网络安全社区和公开数据集的URL数据，旨在用于网络钓鱼网站的检测与识别。主要特征如下：时间跨度：数据未明确标注时间范围，可视为静态数据集，反映了特定时期的网络钓鱼网站特征。地理范围：数据涵盖全球范围内的网络钓鱼网站及相关URL，代表了不同地域的网络钓鱼活动。数据维度：数据集包含多个CSV文件，其中： phishing_site_urls.csv：包含URL和标签（0表示正常网站，1表示钓鱼网站）。 malicious_phish.csv：包含URL和网站类型信息。 Phishing_dataset_01.csv：包含多种URL特征，如IP地址使用、URL长度、SSL状态、域名注册时长等，以及一个“Result”字段，指示该URL是否为钓鱼网站。 Phishing_dataset_03.csv：包含URL、域名、目录、文件和参数中各种字符的数量统计，以及URL长度等特征。 Phishing_dataset_02.csv和Phishing_dataset_04.csv：包含类似Phishing_dataset_01.csv的URL特征和结果标签。数据格式：数据以CSV格式提供，方便数据读取、处理和分析。来源信息：数据来源于网络安全研究、公开数据集等，经过整理和标注，可用于模型训练和评估。该数据集适合用于网络钓鱼网站检测、恶意URL识别、安全威胁情报分析等领域的研究和应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于网络安全、机器学习、数据挖掘等领域的研究，例如URL特征分析、钓鱼网站检测模型的构建与评估。行业应用：为安全行业提供数据支持，可用于构建钓鱼网站检测系统、安全情报分析平台，提升网络安全防护能力。决策支持：支持安全决策，帮助企业和个人识别和防范钓鱼网站攻击，降低安全风险。教育和培训：作为网络安全、机器学习等课程的实训材料，帮助学生和研究人员理解钓鱼网站的特征，并进行模型训练和实验。此数据集特别适合用于探索URL特征与钓鱼网站之间的关联，构建高效的钓鱼网站检测模型，从而提升网络安全防护水平。

数据与资源

网络钓鱼网站检测数据集PhishingWebsiteDetectionDataset-ruckdent.zipZIP
32.34 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	32.34 MiB
最后更新	2025年5月20日
创建于	2025年5月20日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

网络钓鱼网站检测数据集PhishingWebsiteDetectionDataset-ruckdent

数据与资源

附加信息

注册成功！