数据集概述
本数据集关联了伦敦自然历史博物馆馆藏标本与其采集者、鉴定者的信息,由Bionomia平台志愿者标注生成,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,覆盖关联属性、问题日期、文献引用等维度。
文件详解
- 数据文件(Frictionless Data数据包)
- 核心描述文件:
datapackage.json,格式JSON,为数据包的元数据配置文件
- 关联属性文件:
attributions.csv.zip,格式CSV压缩包,记录标本与采集者/鉴定者的关联声明
- 采集者日期问题文件:
problem_collector_dates.csv.zip,格式CSV压缩包,存储采集者日期存在问题的记录
- 鉴定者日期问题文件:
problem_determiner_dates.csv.zip,格式CSV压缩包,存储鉴定者日期存在问题的记录
- 排除声明文件:
not_them_assertions.csv.zip,格式CSV压缩包,记录排除特定关联的声明
- 标本记录文件:
occurrences.csv.zip,格式CSV压缩包,包含标本的基本记录信息
- 文献引用文件:
citations.csv.zip,格式CSV压缩包,关联标本的文献引用数据
- 文章信息文件:
articles.csv.zip,格式CSV压缩包,存储相关学术文章信息
- 用户信息文件:
users.csv.zip,格式CSV压缩包,记录参与标注的志愿者用户数据
数据来源
Bionomia平台志愿者标注,基于Global Biodiversity Information Facility(GBIF)聚合的伦敦自然历史博物馆标本数据集(数据集ID:7e380070-f762-11e1-a439-00145eb45e9a)
适用场景
- 生物标本溯源研究:通过采集者与鉴定者关联数据,追溯标本的采集背景与分类鉴定过程
- 生物多样性数据质量评估:利用问题日期文件分析标本元数据的完整性与准确性
- 志愿者贡献分析:通过用户信息文件研究公民科学项目中志愿者的标注行为与贡献
- 生物分类学文献关联:结合文献引用与文章文件,构建标本与学术研究的关联网络
- 自然历史数据标准化:基于Frictionless Data格式,为生物标本元数据的标准化处理提供参考