OntoLAMA本体包含推理语言模型分析数据集

数据集概述

该数据集是用于本体包含推理(SI)的语言模型探测数据集,基于Schema.org、DOID、FoodOn、GO等真实本体构建,分为原子SI(仅原子概念)和复杂SI(含原子与复杂概念)任务,含多领域多规模的训练/验证/测试数据。

文件详解

  • 压缩文件集合(共8个.zip格式文件):
  • schemaorg-atomic-SI.zip:Schema.org本体的原子SI任务数据集
  • doid-atomic-SI.zip:DOID本体的原子SI任务数据集
  • foodon-atomic-SI.zip:FoodOn本体的原子SI任务数据集
  • foodon-complex-SI.zip:FoodOn本体的复杂SI任务数据集
  • go-atomic-SI.zip:GO本体的原子SI任务数据集
  • go-complex-SI.zip:GO本体的复杂SI任务数据集
  • bimnli.zip:MNLI相关的biMNLI数据集
  • ontologies.zip:原始本体文件集合

适用场景

  • 语言模型知识库能力评估:测试模型对本体包含关系的推理能力
  • 本体推理任务研究:分析原子/复杂概念包含推理的模型表现差异
  • 多领域知识建模:探究不同规模(如Schema.org小样本、GO大规模)本体对模型推理的影响
  • 自然语言推理扩展:研究本体推理任务向NLI范式转化的效果
  • 生物医学/食品科学知识应用:基于DOID、FoodOn等领域本体的模型适配研究
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 107.13 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。