数据集概述
本数据集是通过wdumps工具生成的Wikidata RDF转储,聚焦德国演员相关实体信息。包含实体、标签、描述等结构化数据,以多种文件格式存储,可用于影视领域演员信息的关联分析与知识图谱构建。
文件详解
- 配置与元数据文件
- 文件名称:info.json
- 文件格式:JSON
- 字段映射介绍:包含id、wdtkVersion、toolVersion、dumpDate、tripleCount、entityCount、statementCount等元数据字段
- 文件名称:wdumper-spec.json
- 文件格式:JSON
- 字段映射介绍:包含version、labels、entities、meta、aliases、sitelinks、descriptions、statements等配置字段
- 数据文件
- 文件名称:wdump-986.nt.gz
- 文件格式:GZ压缩的NT文件
- 字段映射介绍:RDF三元组格式的德国演员实体数据
- 文件名称:preview.nt
- 文件格式:NT
- 字段映射介绍:德国演员实体数据的预览文件
适用场景
- 影视行业知识图谱构建:整合德国演员的多维度信息,构建影视领域知识图谱
- 演员关联分析:分析德国演员的职业关系、作品关联等信息
- 语义网数据研究:用于RDF数据格式的解析与应用研究
- 影视数据挖掘:挖掘德国演员的行业特征与发展趋势