找到4个数据集

标签: NLP基准测试

过滤结果
  • OpenLLMText_多源文本数据基于大语言模型文本分析完整数据

    2025年12月12日 30 16 0

    数据集概述 该数据集包含约三十万条文本条目,来源于人类及ChatGPT、PaLM、LLaMA、GPT2-XL四个大语言模型。其中人类文本取自2019年前Reddit用户生成内容,其余模型文本为对人类文本的逐段改写或直接适配,覆盖不同生成式模型的文本特征。 文件详解...
    packageimg
  • 路透社21578基准语料库

    2025年12月8日 30 182 141

    数据集概述 该数据集为路透社21578基准语料库,是一个用于文本分类等任务的经典基准数据集,以压缩文件形式存储,未提供训练/测试、数据/标签等拆分信息。 文件详解 文件名称: RCV1.zip 文件格式: ZIP压缩包(.zip) 内容说明: 该压缩包包含路透社21578基准语料库的相关数据,无可用内容预览,未检测到命名模式或拆分结构。 适用场景...
    packageimg
  • 企业ESG自动评估媒体报道数据挖掘与评估数据集

    2025年12月7日 30 76 4

    数据集概述 本数据集是企业ESG自动评估研究的复现包,包含标注为环境、治理或社会相关的四万三千二百四十一篇新闻标题语料库,以及用于公司检测、ESG分类和情感模型训练评估的代码笔记本,为ESG相关NLP任务提供基准数据。 文件详解 标注语料库文件:...
    packageimg
  • 自然语言处理最新基准测试数据集-2023-mauromauro

    2025年4月22日 30 40 25

    自然语言处理最新基准测试数据集-2023-mauromauro 数据来源:互联网公开数据 标签:NLP,基准测试,机器学习,数据集,科研,教育,PapersWithCode 数据概述: 本数据集包含自然语言处理任务的基准测试数据集记录,每个记录由模型-指标-日期三元组组成。数据来源于Papers With...
    packageimg