数据集概述
本数据集包含美国堪萨斯州立大学小麦遗传资源中心(WGRC)保存的约930份二倍体A基因组小麦物种(乌拉尔图小麦、栽培一粒小麦、野生一粒小麦)的遗传特征分析数据,通过GBS技术鉴定SNP标记,用于遗传多样性、群体结构分析及基因库整理。
文件详解
- 基础信息文件:
- Agenome.sample_info.txt(TXT格式):样本基础信息文件
- Readme.pdf(PDF格式):数据集说明文档
- Key_file_WGRC_Diploid_A-Genome_Wheat_Species_Accessions.xlsx(XLSX格式):包含flowcell、lane编号、barcode、样本名等用于复现分析的关键信息
- SRA_Fastq_Files_WGRC_Diploid_A-Genome_Wheat_Species_Accessions.xlsx(XLSX格式):NCBI SRA数据库原始测序数据关联信息
- SNP数据文件:
- A_genome_core_total_Segregating.SNPs.txt(TXT格式):A基因组核心群体总分离SNP数据
- T.urartu_total_Segregating.SNPs.txt(TXT格式):乌拉尔图小麦总分离SNP数据
- sub.mono_total_Segregating.SNPs.txt(TXT格式):栽培一粒小麦亚种总分离SNP数据
- sub.aeiglopoides.input.Genocore.het.masked.SNPs.file.csv(CSV格式):野生一粒小麦亚种基因型填充及杂合子屏蔽的SNP矩阵
- 分析用数据文件:
- All_Agnome_curated.sample.SNPmatrix.for.phylogenetic.cluster_PCA.txt.zip(ZIP格式):用于系统发育聚类和PCA分析的SNP矩阵
- Agenome_population.structure.input.file.for.FastStructure.str.f.str.zip(ZIP格式):用于FastStructure分析的群体结构输入文件
- All_sample_SNP.matrix.for.genetically.identical.accession.hmp.txt(TXT格式):用于鉴定遗传重复材料的SNP矩阵
数据来源
Wheat Genetics Resource Center (WGRC) at Kansas State University
适用场景
- 小麦遗传资源研究:用于二倍体A基因组小麦物种的遗传多样性分析
- 基因库管理:支持遗传重复材料、错误分类材料的鉴定与整理
- 进化生物学研究:解析二倍体A基因组小麦物种间的进化关系
- 群体遗传学分析:开展群体结构、系统发育聚类等研究
- 分子标记开发:为小麦分子育种提供SNP标记资源