数据集概述
本数据集包含与《坎佩切州社会昆虫区系》相关的自然历史标本数据,关联了标本的采集者和鉴定者信息。数据由Bionomia平台志愿者标注生成,基于Global Biodiversity Information Facility聚合的标本数据集,采用Frictionless Data数据包格式组织,共包含九份文件。
文件详解
- 数据文件包配置
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包的配置文件,定义数据集的元数据信息
- 标本记录数据
- 文件名称:occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:社会昆虫标本的核心记录数据
- 采集者与鉴定者关联数据
- 文件名称:attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:标本与采集者、鉴定者的关联信息
- 采集者日期问题数据
- 文件名称:problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:采集者相关日期数据的问题记录
- 鉴定者日期问题数据
- 文件名称:problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:鉴定者相关日期数据的问题记录
- 排除关联断言数据
- 文件名称:not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:明确排除的标本与人员关联断言记录
- 用户数据
- 文件名称:users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:参与数据标注的用户信息
- 引用文献数据
- 文件名称:citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关文献引用数据
- 文章数据
- 文件名称:articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:相关研究文章数据
数据来源
Bionomia平台(数据集ID:cb7133d4-79c5-4f74-88f5-ada473019c89)、Global Biodiversity Information Facility(数据集ID:cb7133d4-79c5-4f74-88f5-ada473019c89)
适用场景
- 生物标本数据标准化研究:分析采集者、鉴定者与标本记录的关联模式,优化生物标本数据的元数据结构
- 社会昆虫分类学研究:通过标本关联的采集者、鉴定者信息,追溯坎佩切州社会昆虫区系研究的学术脉络
- 生物多样性数据质量评估:利用问题日期数据和排除断言数据,评估生物标本数据的准确性和完整性
- 公民科学参与分析:通过用户数据研究志愿者在生物标本数据标注中的贡献模式与协作机制
- 生物多样性信息基础设施建设:为全球生物多样性信息平台提供标准化的标本关联数据支撑