-
Gollum_Based_大规模多源知识图谱匹配金标准数据集
2026年1月29日 30 99 87
数据集概述 本数据集为Gollum金标准,用于大规模多源知识图谱匹配任务评估,包含四万一千四百九十九个知识图谱间二十七万五千余条对应关系。数据源自DBpedia提取框架生成的维基农场知识图谱,提供无监督、有监督(含同一维基/不同维基训练测试集)三种版本,支持知识图谱匹配方法的有效性与可扩展性验证。 文件详解 XML文件(9个,占比56.25%)...
-
GitTables_Based_SemTab_2022列类型检测基准数据集
2026年1月21日 30 156 124
数据集概述 本数据集是GitTables语料库的子集,专为2022年SemTab竞赛第三轮的列类型检测方法基准测试而整理。包含表格数据文件及对应DBpedia、Schema.org的目标列标注与真值文件,共七个文件,用于评估表格列语义类型检测模型的性能。 文件详解 文件名称:GitTables_SemTab_2022_dataset.zip...
-
表格数据实体链接基准数据集
2025年12月20日 30 143 68
数据集概述 本数据集是用于评估结构化表格数据实体链接算法的基准套件,包含五个子数据集(HTR1、HTR2、Movies、Companies、SN),覆盖学术挑战、维基数据构建及真实采购场景,为算法性能验证提供标准化数据支持。 文件详解...



