数据集概述
本数据集包含IAN标本馆(Embrapa Amazônia Oriental所属,Herbário Virtual REFLORA平台)的自然历史标本关联数据,记录了标本与采集者、鉴定者的关联信息。数据由Bionomia志愿者标注,基于Global Biodiversity Information Facility聚合的标本数据,以Frictionless Data数据包格式组织,共9个文件。
文件详解
- 压缩文件(ZIP格式):共8个,包括citations.csv.zip、attributions.csv.zip、occurrences.csv.zip、users.csv.zip、articles.csv.zip、not_them_assertions.csv.zip、problem_collector_dates.csv.zip、problem_determiner_dates.csv.zip,分别存储引用、归属、标本记录、用户、文章、标注异议、采集者日期问题、鉴定者日期问题的CSV数据。
- 数据包描述文件:datapackage.json(JSON格式),为Frictionless Data数据包的元数据文件,定义数据集结构与属性。
数据来源
Global Biodiversity Information Facility(数据集ID:af0ac0ba-b895-47a2-ac64-30517f109c33)、Bionomia志愿者标注
适用场景
- 生物标本馆人员关联研究:分析IAN标本馆标本采集者与鉴定者的关联网络及贡献情况。
- 标本数据质量评估:通过问题日期文件识别采集者、鉴定者信息中的时间异常数据。
- 生物多样性数据整合:利用归属、引用文件关联标本数据与相关文献、用户信息。
- 志愿者标注成果分析:基于标注异议文件研究Bionomia平台志愿者的标本信息标注质量。