电子邮件垃圾邮件与正常邮件分类预处理数据集-hailinsong

电子邮件垃圾邮件与正常邮件分类预处理数据集-hailinsong 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,电子邮件,文本分类,数据预处理,清理,机器学习

数据概述: 本数据集是基于Kaggle上Hailin Song发布的综合垃圾邮件与正常邮件数据集进行初步处理和清理后的结果。数据集包含2个主要字段:邮件内容(content)为纯文本格式,发件人(sender)主要提取为电子邮件地址。每条记录被标记为1表示垃圾邮件(spam),标记为0表示正常邮件(ham)。该数据集经过清理,去除了噪声和无效数据,为后续的文本分类分析提供了基础。

数据用途概述: 该数据集适用于垃圾邮件过滤系统开发、电子邮件分类研究、机器学习模型训练等场景。研究者可以利用该数据集训练和评估垃圾邮件检测模型,提高电子邮件过滤系统的准确性。同时,数据集也适合用于教育和培训,帮助学习者理解文本分类算法的基本原理和应用。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 3.33 MiB
最后更新 2025年4月23日
创建于 2025年4月23日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。