找到2个数据集

标签: 非结构化文本

过滤结果
  • 企业邮件垃圾分类样本数据集

    2025年6月19日 30 105 12

    数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容...
    packageimg
  • 非结构化文本知识图谱构建数据集-humbleyll

    2025年5月28日 30 146 72

    非结构化文本知识图谱构建数据集-humbleyll 数据来源:互联网公开数据 标签:知识图谱,非结构化文本,自然语言处理,文本挖掘,关系抽取,数据集,机器学习,数据分析 数据概述: 该数据集包含从各种非结构化文本中提取的信息,用于构建知识图谱。主要特征如下: 时间跨度: 数据记录的时间范围取决于原始文本的发布时间,通常涵盖多个时间段。 地理范围:...
    packageimg