-
Gollum_Based_大规模多源知识图谱匹配金标准数据集
2026年1月29日 30 11 10
数据集概述 本数据集为Gollum金标准,用于大规模多源知识图谱匹配任务评估,包含四万一千四百九十九个知识图谱间二十七万五千余条对应关系。数据源自DBpedia提取框架生成的维基农场知识图谱,提供无监督、有监督(含同一维基/不同维基训练测试集)三种版本,支持知识图谱匹配方法的有效性与可扩展性验证。 文件详解 XML文件(9个,占比56.25%)...
-
CoEST_Based_需求分类可追溯性链接恢复基准数据集
2026年1月30日 30 29 22
数据集概述 本数据集包含五个可追溯性链接恢复基准数据集的需求部分分类金标准,涵盖eTour、iTrust、SMOS、eAnci和LibEST五个数据集的预处理需求,其中SMOS和eAnci的原始意大利语需求已自动翻译为英语,用于软件需求分类任务的基准测试。 文件详解 文件名称:dataset.zip 文件格式:ZIP...
-
CodiEsp西班牙语临床病例ICD10编码金标准数据集_CLEF2020
2025年12月19日 30 144 78
数据集概述 该数据集是CLEF eHealth 2020 CodiEsp赛道的西班牙语临床病例金标准语料库,包含训练集、开发集、测试集(含人工注释)及未标注背景集,共一千个临床病例,采用CIE10(西班牙版ICD10)编码术语,为非英语临床病例自动编码研究提供标注数据。 文件详解 数据集为zip压缩包,包含四个文件夹,具体如下: -...
-
MedProcNER医疗程序命名实体识别金标准标注数据集
2025年12月14日 30 120 15
数据集概述 该数据集是用于西班牙语医疗文档中临床程序信息抽取的金标准标注资源,包含训练集七百五十份文档、测试集二百五十份文档,以及SNOMED CT编码词表、SNOMED CT与MeSH交叉映射文件,还提供九种语言的银标准版本,为医疗程序检测与实体链接任务提供支持。 文件详解 文件名称:...



