数据集概述
本数据集为Museu Paraense Emilio Goeldi蜘蛛标本馆(Araneae Collection)的自然历史标本数据,包含标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息 facility(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 文件名称:citations.csv.zip,文件格式:ZIP,字段映射介绍:包含标本相关的引用信息
- 文件名称:problem_determiner_dates.csv.zip,文件格式:ZIP,字段映射介绍:包含鉴定者日期存在问题的标本记录
- 文件名称:occurrences.csv.zip,文件格式:ZIP,字段映射介绍:包含标本的 occurrence(发生)数据
- 文件名称:articles.csv.zip,文件格式:ZIP,字段映射介绍:包含与标本相关的文献文章信息
- 文件名称:attributions.csv.zip,文件格式:ZIP,字段映射介绍:包含标本数据的归属与标注信息
- 文件名称:datapackage.json,文件格式:JSON,字段映射介绍:Frictionless Data数据包的描述文件,定义数据结构与元信息
- 文件名称:users.csv.zip,文件格式:ZIP,字段映射介绍:包含参与数据标注的用户信息
- 文件名称:not_them_assertions.csv.zip,文件格式:ZIP,字段映射介绍:包含“非本人”的标注断言记录
- 文件名称:problem_collector_dates.csv.zip,文件格式:ZIP,字段映射介绍:包含采集者日期存在问题的标本记录
数据来源
Bionomia平台(https://bionomia.net/dataset/eb521f93-d62d-4332-a5f0-989ed94d9cc4),基于全球生物多样性信息 facility(GBIF)聚合的标本数据(https://gbif.org/dataset/eb521f93-d62d-4332-a5f0-989ed94d9cc4)
适用场景
- 生物标本数据管理:用于整理Museu Paraense Emilio Goeldi蜘蛛标本馆的采集者、鉴定者关联信息,完善标本元数据
- 生物多样性研究:分析蜘蛛标本的采集历史、鉴定流程,支撑生物多样性分布与演化研究
- 公民科学项目评估:研究志愿者通过Bionomia平台参与标本数据标注的贡献与质量
- 标本数据质量控制:利用问题日期(采集者/鉴定者)文件,优化标本数据的时间信息准确性
- 生物标本引用分析:通过citations.csv.zip和articles.csv.zip,研究标本在学术文献中的引用情况