数据集概述
该数据集基于蒺藜苜蓿226个种质资源的全基因组测序数据(含超600万个SNP),开展全基因组关联分析(GWAS),探究株高、毛状体密度、开花时间、结瘤等性状的遗传基础,识别候选基因及遗传结构特征。
文件详解
- 数据文件(CSV格式):
- StantonGeddes2013_Medicago_leaf_data.csv:叶片性状数据,字段包括pot(盆号)、Trichomes(毛状体数量)、width_mm(宽度)、petiole_area(叶柄面积)、leaf_area(叶面积)、leaf_weight(叶重)
- StantonGeddes2013_Medicago_nodule_occupancy.csv:结瘤占据数据,字段包括plate(平板号)、row(行)、column(列)、postion(位置)、plant(植株)、strain(菌株)、date(日期)、sheet(工作表)
- StantonGeddes2013_Medicago_plant_data.csv:植株性状数据(未提供预览字段)
- 代码文件(R/PBS格式):
- tassel_results.r、StantonGeddes2013_nodule_occupancy_script.r、tassel_analysis_functions.r:R语言分析脚本
- StantonGeddes2013_script.Rmd:R Markdown分析文档
- tassel_shell.pbs:TASSEL分析批处理脚本
- 说明文档:
- README_for_StantonGeddes2013_Medicago_nodule_occupancy.txt:结瘤数据说明文本
- MtHap_GWA_README.pdf:GWAS分析说明PDF文档
适用场景
- 豆科植物遗传育种研究:挖掘蒺藜苜蓿农艺性状关键基因
- 共生固氮机制研究:分析结瘤性状的遗传调控网络
- GWAS方法学验证:比较全基因组测序与SNP芯片的关联分析差异
- 植物功能基因组学:解析株高、开花时间等性状的分子基础