数据集概述
本数据集为USAC、CECON、Herbario USCG机构的自然历史标本数据,关联了标本的采集者与鉴定者信息。数据由Bionomia平台志愿者标注生成,基于Global Biodiversity Information Facility聚合的标本数据,采用Frictionless Data数据包格式组织,包含9个文件。
文件详解
- 数据文件(压缩包)
- 文件名称:citations.csv.zip、occurrences.csv.zip、articles.csv.zip、problem_determiner_dates.csv.zip、not_them_assertions.csv.zip、attributions.csv.zip、problem_collector_dates.csv.zip、users.csv.zip
- 文件格式:ZIP
- 字段映射介绍:分别包含引文、标本记录、文献、鉴定者日期问题、身份排除声明、贡献归因、采集者日期问题、用户信息等关联数据
- 描述文件
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的元数据描述文件,定义数据集结构与属性
数据来源
Global Biodiversity Information Facility(数据集编号:d5ba665a-c07b-4379-85ff-15d7e3a9331a);Bionomia平台志愿者标注
适用场景
- 生物标本采集者网络分析: 研究USAC、CECON、Herbario USCG机构标本采集者的合作关系与贡献
- 分类学鉴定者历史追溯: 分析标本鉴定者的身份信息与鉴定活动时间线
- 生物多样性数据质控: 利用日期问题文件优化标本采集/鉴定时间记录的准确性
- 标本数据归因研究: 通过贡献归因文件明确标本数据的标注者与来源机构
- 自然历史标本元数据整合: 结合多源数据完善标本记录的采集者、鉴定者关联信息