数据集概述
本数据集为tan-database中的自然历史标本数据关联采集者与鉴定者的信息,由Bionomia志愿者标注,基于Global Biodiversity Information Facility聚合的标本数据构建,采用Frictionless Data package格式,包含9个文件,覆盖标本记录、关联信息、问题数据等内容。
文件详解
- 核心数据文件(.zip格式)
- citations.csv.zip:引用相关数据压缩文件
- occurrences.csv.zip:标本记录数据压缩文件
- not_them_assertions.csv.zip:非关联声明数据压缩文件
- attributions.csv.zip:采集者/鉴定者关联归属数据压缩文件
- users.csv.zip:标注用户数据压缩文件
- problem_collector_dates.csv.zip:采集者日期问题数据压缩文件
- problem_determiner_dates.csv.zip:鉴定者日期问题数据压缩文件
- articles.csv.zip:相关文献数据压缩文件
- 元数据文件
- datapackage.json:Frictionless Data package格式的元数据文件,描述数据集结构与属性
数据来源
Bionomia平台志愿者标注,基于Global Biodiversity Information Facility聚合的tan-database标本数据(数据集ID:e6751193-fafa-4aae-a0c2-f2f1a93172ca)
适用场景
- 生物标本数据关联分析: 研究自然历史标本与采集者、鉴定者的关联关系及数据质量
- 生物多样性数据治理: 分析标本记录中采集者/鉴定者日期等问题数据,优化数据标准化
- 公民科学贡献研究: 基于users.csv.zip数据,探究志愿者对生物标本数据标注的参与模式
- 生物标本引用网络构建: 利用citations.csv.zip和articles.csv.zip数据,构建标本相关文献引用网络