数据集概述
本数据集整合了COVID-19疫情的流行病学、遗传学及政府管控三类数据,均来源于开放数据源。首个版本截止时间为2020年6月底,以Excel工作簿形式提供,包含说明工作表和数据关系可视化工作表,为研究不同数据类型间关联假设提供工具。
文件详解
- 文件名称:data space for combining epi, gen, and string data of COVID-19.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含多个工作表,其中"readme"工作表描述所有工作表的详细数据说明;另有单独工作表提供数据关系的简单可视化;数据集未区分训练/测试、数据/标签或原始/处理数据,原始数据未经清洗。
数据来源
Our World in Data、Worldometer、GISAID-Nextstrain、Oxford COVID-19 Government Response Tracker (OxCGRT)
适用场景
- 疫情多维度关联研究: 分析流行病学、病毒遗传学与政府管控措施之间的潜在关系。
- 疫情政策效果评估: 结合管控数据与流行病学数据,评估不同防控政策对疫情发展的影响。
- 病毒演化与传播分析: 关联遗传学数据与流行病学数据,研究病毒变异与传播趋势的关系。
- 疫情假设验证工具: 作为多源数据整合工具,支持疫情相关各类研究假设的初步验证。