UNIBO_Open_Science_2024_2025_Course_Project_Data

数据集概述

本数据集是2024-2025学年开放科学课程期末项目使用的数据,整合自AMS Acta、Software Heritage、Zenodo和iris四个存储库,包含11个文件,涵盖CSV、JSON和TXT格式,核心为学术文献、软件资源等开放科学相关的结构化与半结构化数据。

文件详解

  • 数据文件
  • CSV格式(7个):包含mashup.csv(合并数据集)、ODS_L1_IR_ITEM_DESCRIPTION.csv(项目描述)、ODS_L1_IR_ITEM_RELATION.csv(项目关系)等,覆盖项目元数据、作者、发布者、标识符等字段。
  • JSON格式(3个):unibo_repositories_swh.json(UNIBO软件遗产仓库数据)、amsacta_filtered_affiliation_or_orcid_doubles.json(AMS Acta过滤数据)、ZenodoData.json(Zenodo平台数据)。
  • 文档文件
  • README.txt:TXT格式,说明数据集标题、作者、联系人等元信息。

数据来源

AMS Acta、Software Heritage、Zenodo、iris

适用场景

  • 开放科学资源整合研究:分析多源开放科学存储库的数据结构与内容关联。
  • 学术元数据分析:基于CSV文件中的文献、作者、发布者等字段,研究学术产出特征。
  • 开放数据平台对比:对比不同存储库(如Zenodo与Software Heritage)的数据格式与元数据规范。
  • 课程教学实践:作为开放科学课程的项目数据,用于数据处理与整合练习。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 558.96 MiB
最后更新 2026年1月11日
创建于 2026年1月11日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。