邮件数据集用于推理攻击分析

邮件数据集用于推理攻击分析

数据来源:互联网公开数据

标签:邮件数据,推理攻击,数据安全,ENRON,SPAMASSASSIN,二分类模型,数据中毒技术

数据概述: 本数据集基于ENRON和SPAMASSASSIN两个公开邮件数据集进行预处理和整合,旨在为研究推理攻击风险提供标准化的数据支持。数据集经过清洗和格式统一,包含以下字段:DATE(日期)、TO(收件人)、FROM(发件人)、BODY(邮件正文),并新增LABEL字段用于标识数据来源(E代表ENRON,A代表SPAMASSASSIN)。最终数据集分为三个版本:单独的ENRON数据集、单独的SPAMASSASSIN数据集,以及包含两者数据的合并版本。

数据用途概述: 该数据集主要用于评估二分类模型在面对数据中毒攻击时的推理攻击风险。研究人员可以利用此数据集进行模型鲁棒性测试,分析数据中毒技术对模型性能的影响,以及探索防御推理攻击的有效策略。此外,数据集也可用于邮件分类任务、垃圾邮件检测研究,或作为教学材料,帮助研究人员理解数据预处理和模型安全的重要性。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 608.6 MiB
最后更新 2025年5月31日
创建于 2025年5月31日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。