-
GitTables基准测试_列类型检测数据集
2025年12月20日 30 16 2
数据集概述 本数据集是GitTables语料库的一个子集,专为列类型检测方法的基准测试设计。它基于DBpedia和Schema.org本体的语义类型,用于评估系统对表格列进行语义标注的能力,曾用于SemTab 2021挑战赛的CTA任务。数据集包含表格样本、目标列信息、标注真值及标签映射文件,支持列类型检测模型的训练与评估。 文件详解...
-
OntoLAMA本体包含推理语言模型分析数据集
2025年12月6日 30 97 57
数据集概述 该数据集是用于本体包含推理(SI)的语言模型探测数据集,基于Schema.org、DOID、FoodOn、GO等真实本体构建,分为原子SI(仅原子概念)和复杂SI(含原子与复杂概念)任务,含多领域多规模的训练/验证/测试数据。 文件详解 压缩文件集合(共8个.zip格式文件): schemaorg-atomic-...



