数据集概述
本数据集为BioRxiv预印本相关研究数据,包含5种真菌的全基因组组装序列(.fasta格式),以及模拟群落和共生体样本的物种分类结果(.xlsx格式)。分类基于自定义数据库、NCBI RefSeq和SILVA数据库,覆盖5种引物对的扩增子测序数据,支持真菌物种分类与基因组研究。
文件详解
- 真菌基因组组装文件(.fasta格式,共5个)
- 文件名称:如Cosmosporella_olovacea_assembled.fasta、Neocucurbitaria salicis-albae_assembled.fasta等
- 内容:包含对应真菌物种的全基因组组装序列,可通过文本编辑器打开
- 物种分类结果文件(.xlsx格式,共4个)
- 文件名称:species_classification_mock.xlsx、species_classification_holobiont_SILVA.xlsx、species_classification_holobiont.xlsx等
- 内容:记录模拟群落和共生体样本的物种分类结果,基于不同数据库(自定义、NCBI RefSeq、SILVA)和引物对(7、8、9、10、3.5)的扩增子测序数据
数据来源
BioRxiv预印本(DOI: 10.1101/2024.11.25.625223 version 2)及ENA数据库(PRJEB82852)
适用场景
- 真菌基因组研究:分析5种目标真菌的基因组序列特征与结构
- 物种分类方法验证:对比不同数据库(自定义、NCBI RefSeq、SILVA)对真菌分类结果的影响
- 引物对性能评估:研究不同引物对(7、8、9、10、3.5)在真菌扩增子测序中的分类效率
- 共生体微生物群落分析:基于共生体样本分类结果,探究真菌与宿主的共生关系
- 生物信息数据库对比:分析自定义数据库、NCBI RefSeq与SILVA在真菌物种分类中的应用差异