数据集概述
本数据集包含国际玉米小麦改良中心(CIMMYT)2013-2020年培育的74,403份面包小麦育种系的基因型数据。通过基因型测序(GBS)构建433个GBS文库,经Illumina平台测序生成440个FASTQ文件,原始数据存储于NCBI BioProject PRJNA498085,数据集含3个文件,支持小麦育种相关分析。
文件详解
- README_CIMMYT_bread_wheat_breeding_lines.txt
- 文件格式:TXT
- 字段映射介绍:描述数据集基本信息,包含作者、数据背景及各文件说明,辅助用户理解数据内容与使用方式。
- key_file_CIMMYT_bread_wheat_breeding_lines_2013-2020.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含样本名称、flowcell、 lane编号、多重样本条形码等元数据字段,用于关联样本与测序文库信息。
- SRA_fastq_files_CIMMYT_bread_wheat_breeding_lines_2013-2020.xlsx
- 文件格式:XLSX
- 字段映射介绍:记录各GBS文库对应的FASTQ文件名及NCBI SRA数据库的访问编号,支持Tassel GBS分析流程的数据调用。
数据来源
国际玉米小麦改良中心(CIMMYT),原始数据存储于美国国家生物技术信息中心(NCBI)BioProject PRJNA498085
适用场景
- 小麦分子标记辅助育种:利用基因型数据筛选与目标性状关联的分子标记,加速优良品种选育。
- 小麦遗传多样性分析:通过育种系基因型信息,研究CIMMYT小麦种质资源的遗传变异与亲缘关系。
- 基因型-表型关联分析:结合表型数据,定位控制产量、抗病性等重要性状的基因位点。
- 小麦育种系追溯:通过样本元数据与SRA编号,追溯特定育种系的基因型测序原始数据,支持重复验证与深入分析。