找到5个数据集

标签: SPACCC

过滤结果
  • BioEsCorpus_西班牙语临床报告生物医学实体关系注释语料库

    2026年1月27日 30 171 51

    数据集概述 本数据集包含对西班牙临床案例语料库(SPACCC)中18份西班牙语临床报告进行生物医学实体与语义关系标注的文件及资源。标注涵盖11类实体和8类语义关系,最终识别出324个实体(涉及10类实体)和170条关系(涉及5类关系),为生物医学文本处理研究提供结构化标注资源。 文件详解 brat_annotations目录...
    packageimg
  • PlanTL_Based_西班牙语临床病例语料库句子分割标注数据集_V1

    2026年1月22日 30 135 81

    数据集概述 本数据集为西班牙临床病例语料库(SPACCC)的句子分割标注第一版,由基于FreeLing3.1的SPACCC词性标注工具完成标注。数据集包含1个压缩文件,无目录层级,无训练/测试、数据/标签等分割,可用于西班牙语临床文本的句子分割任务研究与模型训练。 文件详解 文件名称:SPACCC_SPLIT.zip 文件格式:ZIP...
    packageimg
  • SPACCC_TOKEN_Based_西班牙语临床病例语料库分词标注第一版数据

    2026年1月19日 30 155 129

    数据集概述 本数据集为西班牙语临床病例语料库(SPACCC)的第一版分词标注数据,由基于FreeLing3.1的西班牙语临床病例语料库词性标注器(SPACCC_POS-TAGGER)生成,包含对临床文本的分词标注内容,适用于医学NLP领域的文本处理研究。 文件详解 文件名称:SPACCC_TOKEN.zip 文件格式:ZIP...
    packageimg
  • 西班牙临床病例语料库SPACCC

    2025年12月22日 30 196 81

    数据集概述 该数据集为西班牙语临床病例语料库(SPACCC),是从西班牙开放获取医学出版物(SciELO)中人工分类的临床病例报告集合,包含1000个病例共396,988词,覆盖肿瘤学、泌尿学等多医学专科,兼具生物医学文献与临床记录特征。 文件详解 文件名称:SPACCC.zip 文件格式:ZIP压缩包(.zip)...
    packageimg
  • 西班牙临床病例语料库词性标注数据集

    2025年12月10日 30 14 6

    数据集概述 该数据集是西班牙临床病例语料库(SPACCC)的首个词性标注版本,由基于FreeLing3.1的SPACCC_POS-TAGGER工具完成标注,为临床文本的词性分析提供结构化数据支持。 文件详解 文件名称: SPACCC_POS.zip 文件格式: ZIP压缩包(.zip) 内容说明:...
    packageimg