数据集概述
本数据集通过Trove API采集公共列表的元数据,当前版本为v1.4。为精简文件大小,仅包含列表的核心元数据(如创建时间、唯一标识、资源总数、标题、更新时间),未包含列表内资源的详细信息。数据集仅含一个文件,便于快速获取Trove平台用户创建的公共列表基础信息。
文件详解
- 文件名称:
trove-lists.csv(压缩在GLAM-Workbench/trove-lists-metadata-v1.4.zip中)
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含5个核心字段——created(列表创建日期)、id(Trove唯一列表标识)、number_items(列表内资源总数)、title(列表标题)、updated(列表最后更新日期)。
数据来源
Trove API(通过GLAM Workbench中Trove lists and tags板块的notebook提取)
适用场景
- Trove平台用户行为分析: 分析用户创建公共列表的时间分布、资源数量特征及更新频率。
- 数字资源聚合研究: 基于列表标题和资源总数,探究Trove平台上用户关注的资源主题及聚合趋势。
- GLAM Workbench数据应用: 作为GLAM Workbench项目的一部分,支持对Trove元数据的进一步挖掘与可视化。
- 开放API数据采集方法参考: 为通过API采集平台元数据的实践提供案例参考。