数据集

安然公司电子邮件语料库分类数据集

安然公司电子邮件语料库分类数据集_Enron_Email_Corpus_Classification_Dataset

数据来源：互联网公开数据

标签：电子邮件, 文本分类, 自然语言处理, 情感分析, 邮件主题, 邮件内容, 标签数据, 数据挖掘

数据概述：该数据集包含来自安然公司（Enron）电子邮件语料库的数据，记录了员工之间往来的电子邮件内容，并附带了多类别标签，用于文本分类和分析。主要特征如下：时间跨度：数据记录的时间范围主要集中在2015年5月17日。地理范围：数据来源于美国安然公司，主要涉及该公司内部的电子邮件交流。数据维度：数据集包含多个字段，如“Message-ID”（邮件唯一标识）、“Date”（邮件日期）、“From”（发件人）、“To”（收件人）、“Subject”（邮件主题）、“content”（邮件正文内容）、“user”（用户标识）以及多达12个类别的分类标签（Cat_1至Cat_12，包括level_1, level_2和weight）。数据格式：CSV格式，包含多个子文件，如enron_05_17_2015_with_labels_v2.csv及其分块版本，方便数据处理和分析。数据已进行标签化处理，具备直接用于分类任务的条件。来源信息：数据来源于Enron电子邮件语料库，并经过了处理和标注，以支持分类任务。

数据用途概述：该数据集具有广泛的应用潜力，特别适用于以下场景：研究与分析：适用于自然语言处理、文本挖掘、情感分析、信息检索等领域的学术研究，例如邮件主题识别、用户行为分析、组织结构分析等。行业应用：可以为企业提供电子邮件管理、客户关系管理（CRM）、风险管理等方面的应用支持，例如邮件分类、垃圾邮件过滤、潜在风险评估等。决策支持：支持企业内部沟通分析、信息流管理和风险控制，为管理层提供决策支持。教育和培训：作为自然语言处理、数据挖掘、机器学习等课程的实训素材，帮助学生和研究人员深入理解文本分类和分析方法。此数据集特别适合用于探索电子邮件内容的规律和趋势，帮助用户实现对企业内部沟通的深入理解，提升信息管理效率，并支持风险预警和决策优化。

数据与资源

安然公司电子邮件语料库分类数据集_Enron_Email_Corpus_Classificat...ZIP
642.13 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	642.13 MiB
最后更新	2025年8月15日
创建于	2025年8月15日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。

安然公司电子邮件语料库分类数据集

数据与资源

附加信息

注册成功！