数据集

网络钓鱼网站特征分析数据集PhishingWebsiteFeatureAnalysisDataset-sharmi3754

数据来源：互联网公开数据

标签：网络安全, 钓鱼网站, 机器学习, 特征工程, 网站分析, 恶意软件, 风险评估, 数据挖掘

数据概述：该数据集包含从互联网收集的钓鱼网站和合法网站的特征数据，旨在用于识别和区分钓鱼网站。主要特征如下：时间跨度：数据未明确标注时间，可视为静态数据集。地理范围：数据来源未明确标注地理位置，但涵盖全球范围的网络钓鱼活动。数据维度：数据集包含47个特征，涵盖了URL结构、域名信息、HTML内容、JavaScript行为等多个方面，例如NumDots（域名中点的数量）、UrlLength（URL长度）、PctExtHyperlinks（外部超链接占比）等，以及CLASS_LABEL（类别标签，1代表钓鱼网站，0代表合法网站）。数据格式：CSV格式，文件名为Phishing_Legitimate_full.csv，易于进行数据分析和模型构建。来源信息：数据集来源于公开的网络安全研究，经过特征提取和标注，适用于钓鱼网站检测和分析。该数据集适合用于网络钓鱼网站检测、恶意URL识别、以及安全风险评估等领域的研究和应用。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于网络安全、机器学习领域的学术研究，如钓鱼网站检测算法的开发与评估、恶意URL识别模型构建、以及网站特征对钓鱼行为影响的研究。行业应用：为安全厂商、互联网服务提供商提供数据支持，可用于构建钓鱼网站识别系统、增强网络安全防护能力。决策支持：支持企业和个人用户进行网络安全风险评估，辅助用户识别潜在的钓鱼网站。教育和培训：作为网络安全课程的实训数据，帮助学生和研究人员深入理解钓鱼网站的特征，以及机器学习在网络安全中的应用。此数据集特别适合用于探索钓鱼网站的特征，以及利用这些特征构建高效的检测模型，从而提高网络安全防护水平。

数据与资源

网络钓鱼网站特征分析数据集PhishingWebsiteFeatureAnalysisData...ZIP
0.18 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	0.18 MiB
最后更新	2025年5月18日
创建于	2025年5月18日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

网络钓鱼网站特征分析数据集PhishingWebsiteFeatureAnalysisDataset-sharmi3754

数据与资源

附加信息

注册成功！