数据集概述
本数据集为穿山甲冠状病毒宏基因组污染分析的补充信息,包含3个文件,涉及GD、GX穿山甲冠状病毒相关宏基因组数据集(PRJNA641544、PRJNA606875、PRJNA573298)的分析结果,用于支撑"污染广泛存在削弱穿山甲宿主归因"的研究结论,为病毒基因组研究提供补充数据。
文件详解
- 文件名称:Supp_Info_1_PRJNA641544_DG14_DG18.xlsx
- 文件格式:XLSX
- 字段映射介绍:针对PRJNA641544数据集DG14、DG18样本的分析数据
- 文件名称:Supp_Info_3_PRJNA606875_SRR11093270_reads_blast_nt_seq5_hsps1_PCT80_E0.05_hsps.txt
- 文件格式:TXT
- 字段映射介绍:包含id、title、accession、hit_id等字段,记录PRJNA606875数据集SRR11093270样本reads的blast nt比对结果(参数:seq5、hsps1、PCT80、E0.05)
- 文件名称:Supp_Info_4_PRJNA573298_Analysis.xlsx
- 文件格式:XLSX
- 字段映射介绍:针对PRJNA573298数据集的分析数据
数据来源
论文“Further analysis of metagenomic datasets containing GD and GX pangolin CoVs indicates widespread contamination, undermining pangolin host attribution”
适用场景
- 病毒宏基因组污染分析: 用于研究GD、GX穿山甲冠状病毒宏基因组数据中的污染情况及对宿主归因的影响
- 冠状病毒基因组研究: 辅助分析穿山甲冠状病毒相关宏基因组数据集的可靠性与数据质量
- 生物信息学比对验证: 基于blast nt比对结果,验证宏基因组reads的物种来源准确性
- 医学数据质量评估: 为医学宏基因组数据的污染检测与质量控制提供参考案例