数据集概述
本数据集围绕新世界牛群的祖先起源展开,通过分析54609个单核苷酸多态性(SNP),揭示新世界牛品种及南欧相关牛品种同时具有欧洲原牛(taurine)和印度原牛(indicine)的混合祖先,为研究牛群的全球种群结构、驯化历史及环境适应性提供遗传数据支持。
文件详解
- README_for_RawData_PNAS_updated.txt
- 文件格式:TXT
- 字段映射介绍:说明数据集包含的SNP数据格式为[SNPNUMBER, INDIVIDUAL ID, GENOTYPE],并提及各编号对应的参考文件(如ibmc_markers041709.csv对应SNP编号、ids_full.csv对应个体ID、all_ind_info.csv对应个体信息、breedcodes.csv对应品种代码等),基因型编码规则为1=纯合A、2=纯合B、3=杂合、10=缺失数据。
- RawData_PNAS_updated.zip
- 文件格式:ZIP
- 字段映射介绍:压缩包内包含按品种代码分类的个体SNP数据文件,以及50k和1.8k过滤数据对应的SNP列表文件(50snps.csv、18sn...)等原始数据。
数据来源
论文“New World cattle show ancestry from multiple independent domestication events”
适用场景
- 牛群驯化历史研究:分析新世界牛群的混合祖先起源,验证多独立驯化事件的遗传证据。
- 种群遗传结构分析:探究新世界牛与南欧牛品种的基因流及种群关联性。
- 遗传适应性研究:通过混合祖先的遗传变异,研究牛群对新世界环境的适应性机制。
- 畜牧遗传资源评估:为牛品种的遗传多样性保护及育种改良提供数据参考。