Wikidata_Based_多语言业务信息RDF转储数据

数据集概述

本数据集是通过wdumps工具生成的Wikidata业务相关RDF转储数据,包含韩语和英语两种语言的业务信息。数据集包含4个文件,涉及实体、标签、描述等结构化信息,可用于多语言业务数据的检索与分析。

文件详解

  • info.json
  • 文件格式:JSON
  • 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
  • wdump-2066.nt.gz
  • 文件格式:GZ压缩的NT文件
  • 字段映射介绍:RDF格式的业务数据转储文件
  • wdumper-spec.json
  • 文件格式:JSON
  • 字段映射介绍:包含languages、sitelinks、entities、labels、samplingPercent、meta、descriptions、version、aliases、statements等配置字段
  • preview.nt
  • 文件格式:NT
  • 字段映射介绍:业务数据预览文件

适用场景

  • 多语言业务数据检索:用于韩语和英语业务信息的跨语言查询与整合
  • 知识图谱构建:基于RDF转储数据构建多语言业务知识图谱
  • 数据标准化研究:分析Wikidata业务数据的结构化存储模式
  • 语言资源开发:为自然语言处理模型提供多语言业务语料支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.01 MiB
最后更新 2026年1月29日
创建于 2026年1月29日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。