数据集概述
本数据集为研究论文《果蝇相关宏基因组组装基因组的系统发育与功能多样性》的补充信息,包含支撑研究的补充数据表、图表、分析脚本及相关数据,可通过配套PDF文档了解各表内容说明。
文件详解
- 文档文件:
- dros_mags_SI_v2.pdf:PDF格式,提供各补充数据表的内容说明
- 数据文件:
- S1_table_sequencing_assembly_v2.txt:TXT格式,字段包括物种ID、位置、性别、总序列数、细菌 reads 数、细菌 reads 占比、序列长度(Mb)、reads N50(bp)、MAG数量等
- S2_table_mag_summary.csv:CSV格式,字段包括MAG_ID、宿主物种、果蝇位置、基因组大小、contig数、最长 scaffold、N50 contigs、完整性、污染度、GC含量、目、物种
- S3_table_NCBI_Genomes_To_Taxonomy_Table.txt:TXT格式,NCBI基因组与分类信息对应表
- S4_table_shared_kegg_enrichment.txt:TXT格式,KEGG富集分析结果表
- S5_table_antismash_BG_annotations.csv:CSV格式,字段包括MAG_ID、Contig、Region、Type、位置范围、最相似已知簇、相似度、简短描述、类别
- 脚本与数据压缩包:
- analysis_scripts.zip:ZIP格式,分析脚本压缩包
- mags_45comp10cont.zip:ZIP格式,宏基因组组装基因组数据压缩包
适用场景
- 微生物基因组学研究:分析果蝇相关微生物的系统发育关系与功能多样性
- 宏基因组数据分析:验证或复现论文中的宏基因组组装与功能注释流程
- 微生物生态学研究:探究宿主(果蝇)与共生微生物的关联机制
- 生物信息学方法应用:学习宏基因组数据处理、KEGG富集分析及antiSMASH注释的实践案例