数据集概述
本数据集围绕携带刺突蛋白L452R突变的SARS-CoV-2变异株展开,包含病毒全基因组测序数据、流行病学与统计分析代码、系统发育分析文件及补充表格,支持研究该变异株的传播、感染性及中和特性。
文件详解
该数据集包含16个文件,具体说明如下:
- 基因组数据文件:
- README-genome fasta files.txt:基因组FASTA文件说明文档
- SARS-CoV-2_490seqs_dates.fasta:490条带日期的SARS-CoV-2基因组序列FASTA文件
- SARS-CoV-2_2172genomes_GenBank_corrected_4-19-21_2086genomes_subtracted86 (1).fasta:2086条校正后的SARS-CoV-2基因组序列FASTA文件
- 系统发育分析文件:
- README-phylogenetic-analyses:系统发育分析说明文档
- SARS-CoV-2_Nextstrain_tree_1153seqs.nwk:1153条序列的Nextstrain系统发育树文件(NWK格式)
- SARS-CoV-2_490seqs_dates_beauti.xml:BEAST分析输入XML文件
- SARS-CoV-2_490seqs_dates.run1.log、SARS-CoV-2_490seqs_dates.run2.log、SARS-CoV-2_490seqs_dates.runs1and2.combined.log:BEAST分析日志文件
- SARS-CoV-2_490seqs_dates.run1and2.combined.MCC.tree:合并分析后的最大类群置信度树文件
- 分析代码文件:
- Ct_boxen_plots.ipynb、Ct_boxen_plots.py:Ct值箱线图绘制代码(IPython Notebook及Python格式)
- Ct_welchs_ttest.R:Ct值Welch t检验分析代码(R格式)
- growth_curves.R:生长曲线分析代码(R格式)
- 补充表格文件:
- TableS1_revised.xlsx:修订版补充表S1(Excel格式)
- TableS5.pdf:补充表S5(PDF格式)
适用场景
- 病毒变异研究:分析SARS-CoV-2刺突蛋白L452R突变株的基因组特征与进化关系
- 流行病学分析:研究该变异株的传播速率、倍增时间等流行动力学参数
- 病毒学特性研究:探究L452R变异株的感染性(通过Ct值分析)及中和特性
- 生物信息学方法应用:验证病毒基因组测序数据分析、系统发育树构建等方法的有效性
- 公共卫生决策支持:为评估L452R变异株的公共卫生风险提供数据支撑