找到5个数据集

标签: 医学术语标准化

过滤结果
  • BioEsCorpus_西班牙语临床报告生物医学实体关系注释语料库

    2026年1月27日 30 11 6

    数据集概述 本数据集包含对西班牙临床案例语料库(SPACCC)中18份西班牙语临床报告进行生物医学实体与语义关系标注的文件及资源。标注涵盖11类实体和8类语义关系,最终识别出324个实体(涉及10类实体)和170条关系(涉及5类关系),为生物医学文本处理研究提供结构化标注资源。 文件详解 brat_annotations目录...
    packageimg
  • 西班牙语循证医学临床试验语料库3版

    2025年12月12日 30 13 9

    数据集概述 该数据集是西班牙语的循证医学临床试验语料库(3版),包含一千二百篇文本(二十九万二千一百七十三条词元),涵盖期刊摘要与临床试验公告,标注了医学实体、语义关系等信息,为医学文本分析提供支持。 文件详解 文件名称:CT-EBM-SP-v3.zip 文件格式:ZIP压缩包...
    packageimg
  • 英语医学术语中的一词多义与同音异义数据集

    2025年12月11日 30 59 53

    数据集概述 该数据集聚焦英语医学术语中的一词多义与同音异义现象,包含相关主题的研究文档,为医学术语语义分析及语言特征研究提供资料支持。 文件详解 文件名称: Yunusova Muattar Shokirovna.pdf 文件格式: PDF (.pdf) 文件内容: 文档主题围绕英语医学术语中的一词多义与同音异义展开,具体内容需通过阅读PDF文件获取...
    packageimg
  • Phenopackets_Based_384例表型数据包完整数据集合

    2025年12月7日 30 119 95

    数据集概述 该数据集包含384个遵循GA4GH表型数据包标准的文件,基于已发表病例报告构建,涵盖人类表型本体术语及致病性遗传变异信息,用于表型与基因型关联研究。 文件详解 文件名称: phenopackets.zip 文件格式: ZIP压缩包 内容说明:...
    packageimg
  • DisTEMIST西班牙语临床病例疾病提及检测与标准化数据集

    2025年12月4日 30 68 0

    数据集概述 本数据集为DisTEMIST语料库,包含一千份西班牙语临床病例,病例中的疾病提及经人工标注并映射至SNOMED-CT概念。数据集分为训练集、测试集、背景集,同时提供多语言资源和跨术语映射文件,支持疾病实体检测与标准化相关研究。 文件详解 数据集以压缩包形式提供,核心内容包含以下目录与文件: - 主文件: -...
    packageimg