找到30个数据集

标签: NLP任务

过滤结果
  • SemEval_2020任务1拉丁语词汇语义变化检测数据集

    2025年12月8日   

    数据集概述 本数据集包含SemEval 2020任务1(无监督词汇语义变化检测)的拉丁语测试数据,涵盖两个时期的拉丁语语料库对、40个标注目标词形及其语义变化评分,还提供语料库的原始词形版本,支持词汇语义变化研究。 文件详解 文件名称: semeval2020_ulscd_lat.zip 文件格式: ZIP压缩包 压缩包内包含内容:...
    packageimg
  • 量子技术叙事跨领域分析数据集

    2025年12月8日   

    数据集概述 本数据集为《量子技术叙事:媒体、商业与政策话语的跨领域分析》手稿的配套数据,包含分析所用的文本语料库和主题建模输出,覆盖媒体、商业、政策三个领域的文本数据及对应BERTopic分析结果。 文件详解 Media Articles.zip: ZIP格式压缩文件,包含拆分至单句的媒体文章CSV文件,附带标题、报纸等元数据。 Business...
    packageimg
  • 复杂句子理解数据集

    2025年12月8日   

    数据集概述 该数据集核心为一份PDF文档,围绕复杂句子理解的主题展开,具体内容未提供详细描述,文档名称显示为M.G. Khoshimov相关。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: M.G. Khoshimov.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • ENwikIR1k_维基百科检索开发数据完整集合

    2025年12月7日   

    数据集概述 该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。 文件详解 文件名称: wikIR1k.zip 文件格式: ZIP (.zip) 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息 适用场景...
    packageimg
  • 企业ESG自动评估媒体报道数据挖掘与评估数据集

    2025年12月7日   

    数据集概述 本数据集是企业ESG自动评估研究的复现包,包含标注为环境、治理或社会相关的四万三千二百四十一篇新闻标题语料库,以及用于公司检测、ESG分类和情感模型训练评估的代码笔记本,为ESG相关NLP任务提供基准数据。 文件详解 标注语料库文件:...
    packageimg
  • ERtext_Experiment1_Based_2021实验数据模型文档完整数据

    2025年12月5日   

    数据集概述 该数据集为2021年ERtext实验1的实验数据,包含实验相关的模型文件、仪器说明文档、统计数据及参考模型图片等,覆盖模型、实验、文本等核心主题,为相关研究提供多类型数据支持。 文件详解 模型与仪器文件: Instrument1 (ERtext Reference Model).erdsl:ERtext参考模型文件,格式为.erdsl...
    packageimg
  • 多领域自然语言推理数据集

    2025年4月21日   

    多领域自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,文本蕴含,多领域,机器学习,NLP任务,句对分析,跨领域推理 数据概述: 本数据集为多领域自然语言推理(Multi-Genre Natural Language...
    packageimg
  • HiDoctor波斯语健康美容博客数据集

    2025年4月19日   

    HiDoctor波斯语健康美容博客数据集 数据来源:互联网公开数据 标签:健康,美容,波斯语,NLP任务,博客文章,多标签分类,文本摘要,问答系统,实体识别 数据概述: 本数据集包含40,000篇来自Hi...
    packageimg
  • 迪斯科伊莉西姆对话文本数据集

    2025年4月15日   

    迪斯科伊莉西姆对话文本数据集 数据来源:互联网公开数据 标签:迪斯科伊莉西姆,RPG游戏,对话文本,NLP任务,文学分析,游戏研究 数据概述: 本数据集包含了来自RPG游戏《迪斯科伊莉西姆》的对话文本,旨在用于执行各种自然语言处理任务。数据集涵盖了游戏中丰富多样的对话内容,为语言学研究者和游戏分析者提供了宝贵的资源。 数据用途概述:...
    packageimg
  • 印尼DANA应用评分评论数据集

    2025年4月14日   

    印尼DANA应用评分评论数据集 数据来源:互联网公开数据 标签:DANA应用,印尼,谷歌Play商店,用户评论,评分,情感分析,NLP任务 数据概述: 本数据集收录了从谷歌Play商店印尼版获取的50,000条关于DANA应用的用户评论,每条评论均附带用户名称、评分、评论日期、评论内容以及情感标注。该数据集为自然语言处理任务提供了丰富的文本数据资源。...
    packageimg