钓鱼网站URL特征分析数据集PhishingURLFeatureAnalysisDataset-chaymadh

钓鱼网站URL特征分析数据集PhishingURLFeatureAnalysisDataset-chaymadh

数据来源:互联网公开数据

标签:钓鱼网站, 网络安全, URL分析, 机器学习, 特征工程, 网站安全, 恶意URL, 二分类

数据概述: 该数据集包含从网络安全领域收集的钓鱼网站URL特征数据,旨在用于识别和检测钓鱼网站。主要特征如下: 时间跨度:数据未明确标注时间,可视为静态数据集。 地理范围:数据来源于全球范围内的钓鱼网站。 数据维度:数据集包含多个特征,如"Index"(索引)、"UsingIP"(是否使用IP地址)、"LongURL"(URL长度)、"ShortURL"(使用短URL)、"Symbol@"(是否包含@符号)、"Redirecting//"(是否使用重定向)、"PrefixSuffix-"(前缀/后缀使用情况)、"SubDomains"(子域名数量)、"HTTPS"(是否使用HTTPS)、"DomainRegLen"(域名注册时长)、"Favicon"(Favicon使用情况)、"NonStdPort"(非标准端口使用情况)、"HTTPSDomainURL"(HTTPS域名URL)、"RequestURL"(请求URL)、"AnchorURL"(锚文本URL)、"LinksInScriptTags"(脚本标签中的链接数量)、"ServerFormHandler"(表单处理程序)、"InfoEmail"(信息邮件)、"AbnormalURL"(异常URL)、"WebsiteForwarding"(网站转发)、"StatusBarCust"(状态栏定制)、"DisableRightClick"(禁用右键点击)、"UsingPopupWindow"(使用弹出窗口)、"IframeRedirection"(Iframe重定向)、"AgeofDomain"(域名年龄)、"DNSRecording"(DNS记录)、"WebsiteTraffic"(网站流量)、"PageRank"(网页级别)、"GoogleIndex"(谷歌索引)、"LinksPointingToPage"(指向页面的链接数量)、"StatsReport"(统计报告)和"class"(类别标签,用于指示URL是否为钓鱼网站)。 数据格式:CSV格式,文件名为phishingcsv,便于数据处理和分析。 数据来源:数据来源于网络安全研究和公开数据集,经过清洗和标注。 该数据集适用于钓鱼网站检测、恶意URL识别和网络安全研究。

数据用途概述: 该数据集具有广泛的应用潜力,特别适用于以下场景: 研究与分析:适用于网络安全、机器学习和数据挖掘领域的学术研究,如钓鱼网站检测算法的开发与评估、URL特征重要性分析等。 行业应用:为安全厂商、网络安全服务提供商提供数据支持,用于构建钓鱼网站检测系统、URL信誉评估系统等。 决策支持:支持企业和组织的网络安全风险评估和防御策略制定。 教育和培训:作为网络安全、机器学习等相关课程的实践素材,帮助学生和研究人员理解钓鱼网站的特征和检测方法。 此数据集特别适合用于开发和优化钓鱼网站检测模型,提升网络安全防护能力。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.1 MiB
最后更新 2025年4月29日
创建于 2025年4月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。