数据集概述
本数据集是针对Molecular Ecology期刊2009-2013年289篇文章中419个数据集的遗传数据存档质量评估结果,重点分析时空元数据缺失问题。数据涵盖遗传数据存档率、时空信息完整性、数据可重现性等核心指标,用于支撑"公开遗传数据缺失时空关联"的研究结论,共包含4个相关文件。
文件详解
- 文档文件
- 文件名称:README_for_Data_ME15-008_final.docx
- 文件格式:DOCX
- 字段映射介绍:数据集说明文档,提供数据背景、使用方法及文件内容概述
- 数据文件
- 文件名称:Data_ME15-008_final.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含评估数据的结构化表格,记录各数据集的时空元数据及存档质量信息
- 代码文件
- 文件名称:All results ME15-008_final.R
- 文件格式:R
- 字段映射介绍:用于分析数据的R语言代码脚本,支持结果重现
- 数据文件
- 文件名称:RDat.csv
- 文件格式:CSV
- 字段映射介绍:包含ID、REF ID、Year、Marker_type、Archive_used、Public、Archived_Genetic_data_type、Consistent_codes、Recreate、Geography_Information_type、geo_categories、time_categories等核心评估字段的结构化数据
数据来源
论文"Not the time or the place: the missing spatio-temporal link in publicly available genetic data"
适用场景
- 分子生态学研究:分析公开遗传数据的时空元数据完整性对研究的影响
- 学术期刊数据政策评估:评估期刊强制数据存档政策的实施效果及改进方向
- 遗传数据管理研究:探究遗传数据存档质量的关键影响因素
- 数据可重现性研究:分析遗传数据及元数据的可重现性现状与提升策略
- 生物信息学元数据标准制定:为遗传数据时空元数据的规范存档提供实证依据