数据集概述
本数据集为“人类致病性RNA病毒通过占据独立生态位建立非竞争谱系”研究的补充数据,包含病毒特征、序列信息、突变率、谱系分类等12类表格,以及序列比对、基因树等多类压缩文件,支撑病毒进化与生态位研究。
文件详解
该数据集包含表格文件与压缩文件,具体说明如下:
- 表格文件:
- TableS1_virus_characteristics.xlsx:Excel格式,含病毒缩写、科属、传播方式等特征字段
- TableS2_outgroup_sequences.xlsx:Excel格式,列出外群序列ID
- TableS3_GISAID_acknowledgements.dat:dat格式,SARS-CoV-2序列的GISAID致谢信息
- TableS4_manual_sequence_curation.xlsx:Excel格式,手动序列筛选的关键词记录
- TableS5_EVA_H3N2_subalignments.tsv:tsv格式,EVA和H3N2子树的序列ID
- TableS6_GL_and_ML_lineages.xlsx:Excel格式,GL和ML谱系的序列ID
- TableS7_H3N2_newOld.tsv:tsv格式,H3N2新旧子树的序列ID
- TableS8_mutation_rates_LCA.dat:dat格式,突变率及最近共同祖先日期
- TableS9_dNdS.xlsx:Excel格式,平均dN/dS值
- TableS10_Virus_YearlyCases_GenerationTime.docx:docx格式,年度病例及世代时间估算
- TableS11_metadata.dat:dat格式,序列ID、宿主、分离日期等元数据
- TableS12_key_parameters.xlsx:Excel格式,病毒物种的关键参数及均值
- 压缩文件(.zip格式):
- alignments.zip:ORFeome序列比对文件(不含终止密码子)
- correlatedSubtrees.zip:相关分支子树文件(Newick格式)
- genealogicalTrees.zip:谱系树文件(含全局拓扑、子树等)
- maximallyDiverseSubtrees.zip:最大多样性子树文件
- simulatedTrees.zip:中性模型模拟树文件
- ultrametricTrees.zip:超度量树文件
适用场景
- 病毒进化研究:分析RNA病毒的突变率、谱系分化及最近共同祖先
- 生态位占据机制研究:探究病毒非竞争谱系的生态位分化模式
- 分子流行病学分析:基于序列元数据研究病毒传播与分布特征
- 进化模型验证:利用模拟树与真实谱系树对比验证进化模型
- 抗病毒策略研究:通过病毒特征与治疗现状数据支撑药物研发