数据集概述
本数据集是Coleccion Liquenes标本数据中采集者与鉴定者的关联信息,由Bionomia志愿者标注生成,原始标本数据来源于Global Biodiversity Information Facility聚合的数据集。数据以Frictionless Data包格式组织,包含九份文件,用于记录标本相关的人员关联、引用、用户及问题数据等内容。
文件详解
- 核心数据文件
- 文件名称:citations.csv.zip、users.csv.zip、problem_collector_dates.csv.zip、articles.csv.zip、attributions.csv.zip、not_them_assertions.csv.zip、problem_determiner_dates.csv.zip、occurrences.csv.zip
- 文件格式:ZIP压缩包(内含CSV文件)
- 字段映射介绍:分别记录标本引用信息、用户数据、采集者日期问题数据、相关文献、人员关联归属、非目标人员断言、鉴定者日期问题数据及标本存在记录
- 描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data包的描述文件,包含数据集的元数据信息
数据来源
Global Biodiversity Information Facility聚合数据集(数据集ID:62fcd9d4-ecc4-46fb-a7d5-ef350091c163),由Bionomia志愿者标注生成
适用场景
- 生物标本数据治理: 分析标本采集者与鉴定者信息的准确性,处理日期等问题数据
- 生物多样性研究: 关联标本与相关人员信息,支撑物种分布及采集历史研究
- 科学数据引用分析: 基于citations.csv.zip和articles.csv.zip开展标本相关文献引用研究
- 志愿者标注数据评估: 分析Bionomia平台志愿者标注的标本人员关联数据质量