博客识别数据集

博客识别数据集 数据来源:互联网公开数据 标签:博客识别,网站分类,特征提取,机器学习,网络安全,数据科学 数据概述: 本数据集包含从网站URL中识别页面是否为博客的信息。数据集中的大多数特征来自于文献[1],包含了用于判断页面性质的关键指标。尽管文中部分特征尚未包含在本数据集中,但相关信息将尽快补充。 数据用途概述: 该数据集适用于博客识别、网站分类及网络安全研究等领域。研究人员可以利用此数据集开发和验证博客识别算法,帮助区分博客页面与其他类型的网页。此外,数据集也适用于机器学习模型的训练与测试,支持网络安全防御系统的研究与优化。 参考文献: [1] Vrbančič, G., Fister Jr, I., & Podgorelec, V. (2020). Datasets for phishing websites detection. Data in Brief, 33, 106438.

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.57 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。