数据集概述
本数据集为学术论文《A new lineage nomenclature to aid genomic surveillance of dengue virus》的支撑数据,包含登革病毒谱系命名系统设计所用序列及案例研究数据,涉及越南、坦桑尼亚、巴西等地病毒序列信息,以PDF文档和CSV表格形式呈现,助力登革病毒基因组监测研究。
文件详解
该数据集由19个文件组成,分为数据文件和文档文件两类,具体说明如下:
- 数据文件(共3个,CSV格式):
- pbio.3002834.s003.csv:包含谱系名称、大小、替换数量、最古老样本时间等字段,如1I、1II等谱系的基础信息。
- pbio.3002834.s002.csv:包含病毒序列登录号、采集地点、日期、血清型、旧基因型、新谱系等字段,如MN923103.1(中国,2019年)的谱系信息。
- journal.pbio.3002834.s002.csv:推测为与谱系命名相关的补充数据表格。
- 文档文件(共16个,PDF格式):
- 包含pbio.3002834.s014.pdf、pbio.3002834.s007.pdf等文件,推测为论文的补充材料、方法说明或结果图表文档。
数据来源
PLOS Biology期刊论文《A new lineage nomenclature to aid genomic surveillance of dengue virus》支撑数据
适用场景
- 病毒学研究:用于分析登革病毒的谱系进化、基因型分布及传播规律。
- 公共卫生监测:助力登革病毒基因组监测体系的构建与优化,支持疫情预警。
- 流行病学分析:研究不同地区(越南、坦桑尼亚、巴西等)登革病毒的流行特征与谱系变迁。
- 生物信息学应用:为病毒序列数据的标准化命名及谱系分类算法开发提供数据支撑。