COVID-19疫情与天气特征关联数据集

COVID-19疫情与天气特征关联数据集

数据来源:互联网公开数据

标签:疫情预测,天气数据,温度,风速,湿度,COVID-19,时间序列,数据融合

数据概述: 本数据集整合了COVID-19疫情相关数据与天气特征数据,旨在研究天气因素(如温度、风速、湿度等)是否与COVID-19确诊病例的增长存在关联。数据集中的天气信息来源于NOAA GSOD(Global Summary of the Day)公开数据集,并经过处理与COVID-19疫情训练集进行融合。数据集包含了每日的天气特征记录,覆盖温度、风速、降水量等关键指标,并定期更新以确保数据的时效性。

  • 字段定义:
  • temp:每日平均温度(华氏度,精确到十分之一),缺失值标记为9999.9。
  • max:每日报告的最高温度(华氏度,精确到十分之一),由于不同国家和地区的报告时间不同,可能并非当天的实际最高温度,缺失值标记为9999.9。
  • min:每日报告的最低温度(华氏度,精确到十分之一),同样由于报告时间差异,可能并非当天的实际最低温度,缺失值标记为9999.9。
  • stp:每日平均气压(毫巴,精确到十分之一),缺失值标记为9999.9。
  • wdsp:每日平均风速(节,精确到十分之一),缺失值标记为999.9。
  • prcp:每日总降水量(包括降雨和融化的降雪,单位为英寸,精确到百分之一),通常不以午夜为截止时间,可能包含前一天的部分降水,0.00表示无明显降水(包括微量降水),缺失值标记为99.9。
  • fog:雾的出现指示(1 = 有雾,0 = 无雾/未报告),用于标记当天是否出现雾。

数据用途概述: 本数据集适用于以下场景: 1. 疫情预测研究:通过分析天气特征与COVID-19确诊病例增长之间的关联,研究人员可以探索天气因素对疫情传播的影响,为疫情预测模型提供额外的输入特征。 2. 健康风险评估:可以帮助公共卫生部门评估不同天气条件下疫情传播的风险,优化防疫策略和资源分配。 3. 数据融合与机器学习:数据集中的天气信息可以与COVID-19确诊病例、死亡病例等数据融合,用于构建更复杂的预测模型,提升预测准确性。 4. 时间序列分析:数据集的时间序列特性适合用于研究疫情与天气之间的长期动态关系,识别潜在的季节性或周期性模式。 5. 多学科研究:结合气象学、流行病学和公共卫生等领域,为多学科交叉研究提供数据支持。

数据更新: 该数据集定期更新,确保包含最新天气测量数据,以支持对未来COVID-19传播情况的预测分析。研究人员可以持续关注数据集的更新,以便获取最新的天气与疫情关联信息。

致谢: 特别感谢David Bonin提供的天气数据集检索指南,为本数据集的构建提供了重要支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 0.74 MiB
最后更新 2025年4月14日
创建于 2025年4月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。