数据集概述
本数据集是CETAF与DiSSCo联合发起的COVID19-TAF生物多样性知识中心工作组的成果,包含2020年4月至10月期间通过该工作组活动识别并由GloBI索引的生物相互作用数据,以及相关的综述摘要文件,为研究COVID-19相关生物多样性关联提供支持。
文件详解
该数据集包含多个文件,具体说明如下:
- 综述摘要与统计文件:
- review_summary.tsv:TSV格式,所有受审数据集的评论总数摘要
- review_summary_by_collection.tsv:TSV格式,按数据集分组的评论总数摘要
- indexed_interactions_by_collection.tsv:TSV格式,按机构和集合分类的索引相互作用记录数摘要
- review_comments.tsv.gz:压缩TSV格式,所有数据集的评论详情
- datasets_under_review.tsv:TSV格式,受审数据集的详细信息
- 索引生物相互作用数据文件:
- indexed_interactions_full.tsv.gz:压缩TSV格式,所有受审数据集的完整索引相互作用数据
- indexed_interactions_simple.tsv.gz:压缩TSV格式,简化版索引相互作用数据,含来源机构、分类单元名称、相互作用类型等核心字段
- 程序与日志文件:
- elton.jar:生成报告和索引数据的程序文件
- generate_report.sh:生成报告的脚本文件
- generate_report.log:运行脚本的日志文件
- datasets.zip:源数据集压缩包
数据来源
Consortium of European Taxonomic Facilitaties(CETAF)、Distributed Systems of Scientific Collections(DiSSCo)
适用场景
- 生物多样性研究:分析COVID-19相关的物种相互作用(如病毒-宿主、寄生虫-宿主)模式
- 传染病学研究:探索野生动物宿主与冠状病毒的关联,支持疾病传播风险评估
- 数据索引方法论研究:参考GloBI索引生物相互作用数据的技术流程
- 开放数据应用:基于开放生物相互作用数据集开展跨学科分析