数据集概述
本数据集为Frictionless表格数据包格式,包含6个玫瑰品种、3个植物部位中61种已知代谢物的GC-MS检测数据,代谢物标注有CHEBI标识符和InChi,植物相关信息标注有NCBITaxId和植物本体标识符。数据源自2018年6月《Nature Genetics》发表的玫瑰基因组文章补充材料,用于展示FAIR数据标准及数据再分析应用。
文件详解
- 文件名称:rose-aroma-naturegenetics2018-treatment-group-mean-sem-report-datapackage.json
- 文件格式:JSON
- 字段映射介绍:包含profile、name、title、homepage、version、keywords、licenses、sources、contributors、maintainers、publishers、resources、missingValues等元数据字段,描述数据集基本信息与资源配置
- 文件名称:rose-aroma-naturegenetics2018-treatment-group-mean-sem-report-table-example.csv
- 文件格式:CSV
- 字段映射介绍:包含chemical_name(代谢物名称)、inchi(InChi编码)、chebi_identifier(CHEBI标识符)、var1_levels(变量1水平)、var1_uri(变量1URI)、var2_levels(变量2水平)、var2_uri(变量2URI)、treatment(处理组)、sample_size(样本量)、sample_mean(样本均值)、unit(单位)、sem(标准误)等检测数据字段
数据来源
Nature Genetics 2018年6月发表的玫瑰基因组文章(DOI: https://doi.org/10.1038/s41588-018-0110-3)
适用场景
- 植物代谢组学研究: 分析不同玫瑰品种、植物部位的代谢物组成与含量差异
- 玫瑰香气机制研究: 基于GC-MS检测的挥发性代谢物数据,探究玫瑰香气物质的合成与调控
- FAIR数据标准实践: 作为Frictionless表格数据包示例,用于生物数据标准化存储与共享的方法示范
- 代谢组学数据再分析: 结合Jupyter Notebook(关联GitHub项目)开展代谢物数据的二次挖掘与统计分析
- 植物基因功能验证: 关联玫瑰基因组数据,研究代谢物合成相关基因的功能与表达调控