流感爆发事件预测数据集基于推特

流感爆发事件预测数据集基于推特 数据来源:互联网公开数据 标签:流感,爆发预测,推特数据,公共卫生,时间序列,空间分布,关键词分析

数据概述: 本数据集旨在通过分析推特上的流感相关推文,预测不同地区和日期的流感爆发空间时间模式。数据来源于美国,涵盖不同州在不同周的推文数据。具体任务是对每个州每周的推文进行分析,预测下一周是否会爆发流感。根据美国疾病控制与预防中心(CDC)的流感活动地图,流感活动分为从最低到最高的四个等级,如果活动等级达到最高,则认为发生了流感爆发。

数据用途概述: 该数据集适用于流感爆发预测、公共卫生监测、时空数据分析等多种场景。研究人员可以通过分析推文数据,预测流感活动的空间和时间分布;公共卫生机构可以利用这些预测结果进行资源分配和干预措施规划;政策制定者可以根据预测结果评估公共卫生政策的有效性。此外,数据集也适合用于教育培训,帮助学习者理解流感爆发的预测方法和数据分析技巧。

变量信息: 预测任务的输入是每个州每周所有推文中指定关键词的计数。输出是下一周该州是否会发生流感爆发,若无爆发则为零,否则为一。以下是所有变量的简要说明:

flu_locations:州列表。 flu_keywords:关键词列表,包含525个指定关键词。 flu_X_:所有地点和所有周的输入数据。 flu_Y_:所有地点和所有周的输出数据。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 4.33 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。