找到55个数据集

标签: NLP任务

过滤结果
  • fauna_bororo_v0_1_Based_语言结构研究完整数据集

    2025年12月12日   

    数据集概述 本数据集包含与语言结构相关的压缩文件,核心围绕LanguageStructure/fauna_bororo-v0.1.zip展开,未提供具体内容描述,文件类型单一,为压缩格式,无额外目录结构或数据划分信息。 文件详解 文件名称:LanguageStructure/fauna_bororo-v0.1.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 同形异义词与同音异义词关联数据集

    2025年12月11日   

    数据集概述 本数据集聚焦于同形异义词与同音异义词的关联研究,包含一份PDF格式的相关文档,为语言文字领域中词汇语义与语音关系的分析提供基础资料。 文件详解 文件名称: Jurayeva Zulayxo Shamsiddinovna.pdf 文件格式: PDF(.pdf) 内容说明:...
    packageimg
  • MESINESP2西班牙语生物医学语义索引标注语料库

    2025年12月11日   

    数据集概述 该数据集为MESINESP2任务生成的人工标注语料库,包含科学文献、临床试验、专利摘要三类西班牙语生物医学文档,由领域专家使用DeCS受控词汇标注,旨在推动非英语生物医学内容语义索引工具的开发。 文件详解 子任务语料压缩包:...
    packageimg
  • 比尔肯特土耳其语写作数据集2014_2025

    2025年12月10日   

    数据集概述 该数据集是比尔肯特大学2014-2025年土耳其语101和102课程的学生创意写作汇编,包含九千一百一十九篇原创文本,聚焦创造力、内容、语法等维度。2.0版本较初始版扩充约百分之三十三内容,是学术研究用公开土耳其语创意写作语料库之一。 文件详解 文本数据文件:...
    packageimg
  • 数学与哲学相关两篇短文

    2025年12月9日   

    数据集概述 该数据集包含两篇关于数学与哲学的短文,分别介绍数学哲学中的形式主义观点(认为数学和逻辑陈述是符号串按规则操作的结果)和柏拉图主义观点(数学断言的真值依赖于时空外的柏拉图实体)。 文件详解 文件名称:...
    packageimg
  • SemEval_2020任务1拉丁语词汇语义变化检测数据集

    2025年12月8日   

    数据集概述 本数据集包含SemEval 2020任务1(无监督词汇语义变化检测)的拉丁语测试数据,涵盖两个时期的拉丁语语料库对、40个标注目标词形及其语义变化评分,还提供语料库的原始词形版本,支持词汇语义变化研究。 文件详解 文件名称: semeval2020_ulscd_lat.zip 文件格式: ZIP压缩包 压缩包内包含内容:...
    packageimg
  • 量子技术叙事跨领域分析数据集

    2025年12月8日   

    数据集概述 本数据集为《量子技术叙事:媒体、商业与政策话语的跨领域分析》手稿的配套数据,包含分析所用的文本语料库和主题建模输出,覆盖媒体、商业、政策三个领域的文本数据及对应BERTopic分析结果。 文件详解 Media Articles.zip: ZIP格式压缩文件,包含拆分至单句的媒体文章CSV文件,附带标题、报纸等元数据。 Business...
    packageimg
  • 复杂句子理解数据集

    2025年12月8日   

    数据集概述 该数据集核心为一份PDF文档,围绕复杂句子理解的主题展开,具体内容未提供详细描述,文档名称显示为M.G. Khoshimov相关。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: M.G. Khoshimov.pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • ENwikIR1k_维基百科检索开发数据完整集合

    2025年12月7日   

    数据集概述 该数据集是通过wikIR工具获取的开发数据集,包含一个压缩文件,未进行训练/测试、数据/标签或原始/处理的拆分,为相关研究提供基础数据支持。 文件详解 文件名称: wikIR1k.zip 文件格式: ZIP (.zip) 内容说明: 压缩包内包含通过wikIR工具获取的开发数据集内容,具体字段及结构未提供预览信息 适用场景...
    packageimg
  • 企业ESG自动评估媒体报道数据挖掘与评估数据集

    2025年12月7日   

    数据集概述 本数据集是企业ESG自动评估研究的复现包,包含标注为环境、治理或社会相关的四万三千二百四十一篇新闻标题语料库,以及用于公司检测、ESG分类和情感模型训练评估的代码笔记本,为ESG相关NLP任务提供基准数据。 文件详解 标注语料库文件:...
    packageimg
  • ERtext_Experiment1_Based_2021实验数据模型文档完整数据

    2025年12月5日   

    数据集概述 该数据集为2021年ERtext实验1的实验数据,包含实验相关的模型文件、仪器说明文档、统计数据及参考模型图片等,覆盖模型、实验、文本等核心主题,为相关研究提供多类型数据支持。 文件详解 模型与仪器文件: Instrument1 (ERtext Reference Model).erdsl:ERtext参考模型文件,格式为.erdsl...
    packageimg
  • 多领域自然语言推理数据集

    2025年4月21日   

    多领域自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,文本蕴含,多领域,机器学习,NLP任务,句对分析,跨领域推理 数据概述: 本数据集为多领域自然语言推理(Multi-Genre Natural Language...
    packageimg
  • HiDoctor波斯语健康美容博客数据集

    2025年4月19日   

    HiDoctor波斯语健康美容博客数据集 数据来源:互联网公开数据 标签:健康,美容,波斯语,NLP任务,博客文章,多标签分类,文本摘要,问答系统,实体识别 数据概述: 本数据集包含40,000篇来自Hi...
    packageimg
  • 迪斯科伊莉西姆对话文本数据集

    2025年4月15日   

    迪斯科伊莉西姆对话文本数据集 数据来源:互联网公开数据 标签:迪斯科伊莉西姆,RPG游戏,对话文本,NLP任务,文学分析,游戏研究 数据概述: 本数据集包含了来自RPG游戏《迪斯科伊莉西姆》的对话文本,旨在用于执行各种自然语言处理任务。数据集涵盖了游戏中丰富多样的对话内容,为语言学研究者和游戏分析者提供了宝贵的资源。 数据用途概述:...
    packageimg
  • 印尼DANA应用评分评论数据集

    2025年4月14日   

    印尼DANA应用评分评论数据集 数据来源:互联网公开数据 标签:DANA应用,印尼,谷歌Play商店,用户评论,评分,情感分析,NLP任务 数据概述: 本数据集收录了从谷歌Play商店印尼版获取的50,000条关于DANA应用的用户评论,每条评论均附带用户名称、评分、评论日期、评论内容以及情感标注。该数据集为自然语言处理任务提供了丰富的文本数据资源。...
    packageimg