Wikidata_Based_艺术品陈述不确定性与争议标记数据

数据集概述

本数据集精选自Wikidata中所有艺术品的陈述数据,聚焦陈述的不确定性与争议特征。包含四种类型的JSON文件,分别记录带“陈述性质”限定符、非断言、空值对象及带“来源情况”限定符的陈述,总计4个文件,用于分析艺术品元数据的质量与争议性。

文件详解

  • natures.json
  • 文件格式:JSON
  • 字段映射介绍:存储带有“陈述性质”限定符(P5102)的陈述,包含283个可用术语中的54个不确定性或争议性术语(如“有争议”“假设”“可能”),标记陈述的不确定状态。
  • non-asserted.json
  • 文件格式:JSON
  • 字段映射介绍:包含非断言的陈述,通过优先级机制(优选、正常、弃用)区分竞争陈述,仅对被判定为真实的陈述添加额外三元组。
  • null-valued.json
  • 文件格式:JSON
  • 字段映射介绍:存储对象为空值的陈述,关联空白节点表示陈述对应未知值而非缺失陈述,如未知创作者、作者等信息。
  • sourcing-circumstances.json
  • 文件格式:JSON
  • 字段映射介绍:存储带有“来源情况”限定符的陈述,仅选择含不确定性限定符的内容。

适用场景

  • 知识图谱质量评估:分析Wikidata艺术品元数据中陈述的不确定性与争议性分布,优化元数据质量。
  • 艺术品信息标准化研究:探索艺术品陈述中不确定信息的标记规则与表达范式。
  • 语义网争议处理机制研究:基于非断言陈述的优先级机制,研究知识图谱中冲突信息的处理逻辑。
  • 文化遗产元数据管理:为博物馆、档案馆等机构的艺术品元数据记录提供不确定性信息的管理参考。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 515.21 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。