数据集概述
本数据集为探究水稻单倍型块大小对基因组选择准确性及上位性互作影响的实证研究数据,包含2020至2022年多亲本及双亲子代群体的表型与基因型数据,以及用于数据处理、分析的R脚本,支持相关统计模型与基因组预测研究。
文件详解
该数据集由多个目录和文件组成,具体说明如下:
- 001 Phenotypic Data 目录:
- 存储格式:CSV (.csv)
- 内容:包含MP6-8(多亲本)、MP2(双亲本)群体2020-2022年试验的原始表型数据,以及预备产量试验(PYT)数据,涉及性状包括 grain yield(产量)、days to heading(抽穗期)、chalk(垩白度)、whole milling(整精米率),示例文件如 project_20mp2.csv。
- 子目录:MP materials/(MP群体材料表型数据)、Preliminary Yield Trials/(预备产量试验表型数据)
- 002 Genotypic Data 目录:
- 存储格式:CSV (.csv)
- 内容:包含MP2、MP6-8、MP4群体的基因型数据(剂量矩阵格式,值为0、1、2),含2020-2022年PYT的填充与未填充数据;另有LDdistance.csv文件,记录LSU500 SNP距离数据,示例文件如 MP2_Numeric_wright.csv、MP6-8_Numeric_notimputed.csv。
- 003 Scripts 目录:
- 存储格式:R脚本 (.R)
- 内容:用于数据处理、空间调整、基因组选择分析及矩阵计算的R脚本,示例文件如 006-b Predictions MP and PYT - Genomic Selection.R(基因组选择预测)、007 LD calculation.R(连锁不平衡计算)。
- 说明文件:
- README.txt:数据集整体说明文档
- 003 Scripts/README.txt:脚本目录说明文档
适用场景
- 水稻育种研究:分析单倍型块大小对基因组选择准确性的影响,优化分子育种策略
- 数量遗传学研究:探究水稻性状的上位性互作机制
- 生物信息学分析:验证基因组预测模型在作物遗传数据中的应用效果
- 农业大数据应用:支持作物表型与基因型关联分析,挖掘重要农艺性状的遗传基础