数据集概述
本数据集为西部新北区Cybaeina蜘蛛属修订研究(含新属Neocybaeina和Rothaeina描述)关联的采集者与鉴定者自然历史标本数据。由Bionomia志愿者标注,基于Global Biodiversity Information Facility聚合的标本数据,以Frictionless Data包格式组织,含9个文件。
文件详解
- 数据集包描述文件
- 文件名称:
datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data标准的数据集元数据描述文件,通常包含数据集基本信息、资源列表、模式定义等核心元数据。
- 文献引用数据文件
- 文件名称:
citations.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含研究相关的文献引用信息,如文献ID、标题、作者、发表信息等。
- 文章数据文件
- 文件名称:
articles.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含与研究相关的学术文章信息,如文章标识、内容摘要、发表细节等。
- 鉴定者日期问题数据文件
- 文件名称:
problem_determiner_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含鉴定者相关的日期问题记录,如日期缺失、格式错误等异常信息。
- 归属信息数据文件
- 文件名称:
attributions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含标本数据的归属信息,如采集者、鉴定者的归属声明、标注者信息等。
- 排除声明数据文件
- 文件名称:
not_them_assertions.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含排除某些人员作为采集者或鉴定者的声明记录。
- 用户数据文件
- 文件名称:
users.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含参与数据标注的Bionomia用户信息,如用户ID、角色、贡献记录等。
- 标本 occurrence数据文件
- 文件名称:
occurrences.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含蜘蛛标本的 occurrence 信息,如标本ID、采集地点、时间、物种鉴定结果等核心标本数据。
- 采集者日期问题数据文件
- 文件名称:
problem_collector_dates.csv.zip
- 文件格式:CSV(压缩包)
- 字段映射介绍:推测包含采集者相关的日期问题记录,如采集日期缺失、格式错误等异常信息。
数据来源
Bionomia(志愿者标注),基于Global Biodiversity Information Facility聚合的标本数据(数据集ID:455b35db-6097-4725-a57b-c651bc04007e)
适用场景
- 蜘蛛分类学研究: 用于分析西部新北区Cybaeina属及新属Neocybaeina、Rothaeina的分类修订依据与标本数据支撑。
- 生物多样性数据质量评估: 利用问题日期文件分析标本数据中采集、鉴定日期的质量问题及改进方向。
- 标本数据归属研究: 通过归属信息文件探究自然历史标本采集者与鉴定者的贡献记录及数据标注过程。
- 生物多样性信息学应用: 基于Frictionless Data包格式,支持与其他生物多样性数据集的标准化整合与互操作。
- 公民科学贡献分析: 通过用户数据文件研究Bionomia志愿者在生物多样性数据标注中的角色与贡献模式。