数据集概述
本数据集记录波兰科学院动物研究所(PAS)双翅目标本馆中,标本与采集者、鉴定者的关联信息。数据由志愿者通过Bionomia平台标注,基于全球生物多样性信息机构(GBIF)聚合的标本数据,以Frictionless Data数据包格式组织,包含9个文件,支持生物标本采集与鉴定人员关联分析。
文件详解
- 数据文件包(Frictionless Data package)
- 文件名称:datapackage.json
- 文件格式:JSON
- 字段映射介绍:Frictionless Data数据包描述文件,定义数据集元信息(如结构、格式、来源等)
- 压缩数据文件(共8个.zip格式文件)
- citations.csv.zip:引用数据压缩包
- users.csv.zip:用户数据压缩包
- not_them_assertions.csv.zip:非关联声明数据压缩包
- occurrences.csv.zip:标本记录数据压缩包
- problem_determiner_dates.csv.zip:鉴定者日期问题数据压缩包
- attributions.csv.zip:归属信息数据压缩包
- articles.csv.zip:文献数据压缩包
- problem_collector_dates.csv.zip:采集者日期问题数据压缩包
- 文件格式:ZIP(包含CSV文件)
- 字段映射介绍:各压缩包内包含对应主题的结构化CSV数据,具体字段需解压后查看原始CSV文件
数据来源
- Bionomia平台志愿者标注
- 全球生物多样性信息机构(GBIF)聚合的PAS动物研究所双翅目标本数据集(数据集ID:f4ae0140-9fcc-11da-a90c-b8a03c50a862)
适用场景
- 生物标本采集者网络分析:研究双翅目标本采集者的地域分布、合作关系及采集活动规律
- 分类学鉴定者贡献评估:分析鉴定者对双翅目分类学研究的贡献度及时空分布
- 标本数据质量优化:通过日期问题文件(problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip)识别并修正标本记录中的时间信息错误
- 生物多样性研究数据关联:将标本数据与采集者、鉴定者信息关联,支撑双翅目物种分布、分类演化等研究
- 公民科学项目评估:分析Bionomia平台志愿者标注数据的质量与覆盖范围,为生物标本众包标注项目提供参考