数据集概述
本数据集包含病原菌Ceratocystis manginecans与Ceratocystis fimbriata的基因组数据,用于Fourie等人2019年发表的QTL定位研究。数据涵盖MinION组装基因组序列及Illumina HiSeq测序读段,同时提供将SNP数据转换为二进制数据的Python脚本,支持下游分析。
文件详解
- 基因组序列文件:
- File S1 27 contigs from C. manginecans CMW46461.fasta: FASTA格式,包含Ceratocystis manginecans菌株CMW46461的27个基因组contig序列
- File S2 16 contigs from C. fimbriata CMW14799.fasta: FASTA格式,包含Ceratocystis fimbriata菌株CMW14799的16个基因组contig序列
- 数据转换脚本:
- VCF2ABv4.py: Python脚本,用于将SNP数据(VCF格式)转换为二进制数据,支持下游分析
适用场景
- 真菌基因组学研究: 分析Ceratocystis属病原菌的基因组结构与遗传特征
- 植物病理学研究: 支持QTL定位分析,探究病原菌菌丝生长及宿主侵染性的遗传基础
- 生物信息学分析: 利用基因组序列数据开展基因注释、比较基因组学及进化分析
- 数据处理方法开发: 基于VCF2ABv4.py脚本优化SNP数据转换流程,辅助下游统计分析