基于本体模式的知识图谱构建基准数据集_OSKGC

数据集概述

该数据集是用于基于预定义本体模式构建知识图谱的基准数据集,包含文本-三元组-模式数据对、预定义本体模式、统一本体层次结构三个核心组件,基于WebNLG的文本-三元组对扩展构建,为相关任务提供标准化评估基础。

文件详解

  • 文件名称: OSKGC.zip
  • 文件格式: ZIP压缩包
  • 包含内容:
  • 文本-三元组-模式数据对(benchmark/data目录):含10,183条文本条目,按三元组数量(1、2、3个)分为三组,每组覆盖19个主题类别,共57个类别;每条文本对应结构化三元组及本体模式,包含207种实体类型和382种关系
  • 预定义本体模式(benchmark/ontology目录):每个类别对应专用本体模式,包含实体类型、关系及层级结构
  • 统一本体层次结构(benchmark/hierarchy.xml文件):基于DBpedia本体类构建的标准化包含层次结构,以XML格式存储

适用场景

  • 知识图谱构建任务的模型训练与性能评估
  • 本体驱动的信息抽取算法研究
  • 文本到结构化知识转换的方法验证
  • 语义网领域中本体模式应用的实证分析
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.72 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。