路透社21578基准语料库

数据集概述

该数据集为路透社21578基准语料库,是一个用于文本分类等任务的经典基准数据集,以压缩文件形式存储,未提供训练/测试、数据/标签等拆分信息。

文件详解

  • 文件名称: RCV1.zip
  • 文件格式: ZIP压缩包(.zip)
  • 内容说明: 该压缩包包含路透社21578基准语料库的相关数据,无可用内容预览,未检测到命名模式或拆分结构。

适用场景

  • 文本分类研究: 可用于测试和比较不同文本分类算法的性能。
  • 信息检索实验: 适用于信息检索模型的训练与评估。
  • 自然语言处理基准测试: 作为经典语料库,用于验证NLP模型在新闻文本处理任务中的效果。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 12.78 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。