找到4个数据集

格式: ZIP 标签: Brat格式

过滤结果
  • PharmaCoNER药物物质化合物蛋白质命名实体识别西班牙语临床案例报告语料库

    2025年12月23日 30 14 8

    数据集概述 该数据集是PharmaCoNER共享任务的人工标注黄金标准语料库,包含1000篇西班牙语临床案例报告,覆盖肿瘤学、泌尿学等多个医学领域,标注了药物物质、化合物、蛋白质等实体,适用于生物医学命名实体识别研究。 文件详解 文件名称: pharmaconer.zip 文件格式: ZIP压缩文件 内容说明:...
    packageimg
  • MEDDOCAN西班牙语临床病例报告匿名化标注数据集

    2025年12月16日 30 69 50

    数据集概述 该数据集包含MEDDOCAN共享任务的训练、开发、测试集(含黄金标准标注)及背景集(无标注),用于西班牙语临床病例报告的文档匿名化研究。标注采用Brat和XML格式,支持格式转换,为医学文本去标识任务提供标准化数据。 文件详解 文件名称: meddocan.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • Cantemist肿瘤临床病例CIE_O_3术语标注金标准语料库

    2025年12月9日 30 195 135

    数据集概述 该数据集是Cantemist共享任务语料库,包含训练集、开发集、测试集及背景集,涵盖cantemist-ner、cantemist-norm、cantemist-coding三个子任务的金标准标注数据,背景集为无标注文档,用于西班牙语癌症文本挖掘研究。 文件详解 数据集包含一个压缩文件,具体说明如下: - 文件名称:...
    packageimg
  • 西班牙语COVID_19推文职业检测黄金标准标注数据集2021

    2025年12月6日 30 64 27

    数据集概述 本数据集包含一万条带黄金标准标注的西班牙语COVID-19推文,按训练集、验证集、测试集以六十比二十比二十比例划分,涵盖职业分类与命名实体识别两个子任务的标注数据,同时提供多格式文件及工具脚本,支持自然语言处理模型训练与评估。 文件详解 数据集为压缩包格式,包含两个子任务相关文件,具体说明如下: - subtask-1(职业分类子任务):...
    packageimg