数据集概述
本数据集是2024-2025学年开放科学课程期末项目使用的数据,整合自AMS Acta、Software Heritage、Zenodo和iris四个存储库,包含11个文件,涵盖CSV、JSON和TXT格式,核心为学术文献、软件资源等开放科学相关的结构化与半结构化数据。
文件详解
- 数据文件
- CSV格式(7个):包含
mashup.csv(合并数据集)、ODS_L1_IR_ITEM_DESCRIPTION.csv(项目描述)、ODS_L1_IR_ITEM_RELATION.csv(项目关系)等,覆盖项目元数据、作者、发布者、标识符等字段。
- JSON格式(3个):
unibo_repositories_swh.json(UNIBO软件遗产仓库数据)、amsacta_filtered_affiliation_or_orcid_doubles.json(AMS Acta过滤数据)、ZenodoData.json(Zenodo平台数据)。
- 文档文件
README.txt:TXT格式,说明数据集标题、作者、联系人等元信息。
数据来源
AMS Acta、Software Heritage、Zenodo、iris
适用场景
- 开放科学资源整合研究:分析多源开放科学存储库的数据结构与内容关联。
- 学术元数据分析:基于CSV文件中的文献、作者、发布者等字段,研究学术产出特征。
- 开放数据平台对比:对比不同存储库(如Zenodo与Software Heritage)的数据格式与元数据规范。
- 课程教学实践:作为开放科学课程的项目数据,用于数据处理与整合练习。