数据集概述
本数据集是芬兰图尔库大学TUR-V Vainio地衣标本馆中,与采集者和鉴定者相关联的自然历史标本数据。数据由志愿者在Bionomia平台上标注,基于全球生物多样性信息设施(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据包描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据文件,描述数据集的结构、文件清单及相关属性。
- 关联数据文件(压缩包格式)
- 文件名称:citations.csv.zip、users.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、occurrences.csv.zip
- 文件格式:CSV(压缩为ZIP)
- 字段映射介绍:包含标本与采集者、鉴定者的关联信息,具体字段需解压后查看,推测涵盖引用、用户、归因、日期问题记录、文献、排除断言及标本 occurrence 数据等内容。
数据来源
Bionomia平台(志愿者标注),原始标本数据来自全球生物多样性信息设施(GBIF)数据集ea56c0ed-fdae-4689-bda4-96c7df113c94
适用场景
- 生物标本采集者与鉴定者网络分析: 研究地衣标本采集者、鉴定者的合作关系及贡献度。
- 标本数据质量评估: 通过problem_collector_dates等文件分析标本日期标注问题,优化数据质量。
- 生物多样性历史研究: 结合采集者信息追溯地衣标本的采集历史与地理分布。
- 自然历史标本馆数据标准化: 参考Frictionless Data格式,提升标本馆数据的互操作性。