柏林国家图书馆旧主题目录元数据集2023

数据集概述

本数据集提供柏林国家图书馆旧主题目录(ARK)的描述性元数据,包含1500至1955年间2619397条文献记录,共375列,以列存储格式呈现。数据于2023年12月从德国中央图书馆系统(CBS)下载,支持书籍史、科学书籍副文本格式及元数据模式识别等研究。

文件详解

  • 文件名称: Three Use Cases for the ARK Metadata.pdf:PDF格式,提供该元数据集的三个应用案例说明。
  • 文件名称: Metadata of the “Alter Realkatalog” (ARK) of Berlin State Library (SBB)-V2.md:MD格式,可能包含数据集的版本说明或文档。
  • 文件名称: ARK-Metadaten.parquet:Parquet格式,存储2619397条文献记录的描述性元数据,共375列,覆盖1500至1955年的文献信息。

数据来源

德国中央图书馆系统(CBS)

适用场景

  • 书籍史研究:分析1500至1955年间书籍的历史演变
  • 科学书籍副文本研究:探究1800至1955年间科学书籍的副文本格式特征
  • 元数据模式识别:基于书目元数据开展模式识别分析
  • AI应用开发:为图书相关AI模型训练提供结构化元数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 916.38 MiB
最后更新 2025年12月10日
创建于 2025年12月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。