马来西亚新冠疫情数据集
数据来源:互联网公开数据
标签:新冠疫情,马来西亚,公共卫生,数据可视化,数据分析,健康统计,传染病监测
数据概述:
本数据集收录了马来西亚自2020年1月至今的新冠疫情详细记录,涵盖了28个关键变量。这些变量包括新增病例数、7天滚动平均新增病例数、康复人数、活跃病例数、本土病例数、境外输入病例数、重症监护室占用人数、死亡人数以及累计死亡人数等。此外,数据集还包含了接受检测人数、累计接受检测人数、阳性率和7天滚动平均阳性率等重要指标。数据源自Twitter上的马来西亚卫生部@DGHisham账号的推文以及马来西亚卫生部官网的每日疫情更新页面。
数据用途概述:
该数据集适用于疫情趋势分析、公共卫生政策制定、传播模式研究等场景。研究人员可以利用此数据进行时间序列分析,了解马来西亚疫情的动态变化趋势;政策制定者可以根据数据制定和评估公共卫生政策的有效性;数据科学社区和公众可以借助数据进行可视化分析,更好地理解和应对新冠疫情。此外,数据集也适合用于教育培训,帮助学习者掌握数据分析和数据可视化的技能。
举例:
本数据集中的“New case”变量表示每日新增病例数,而“Positivity rate”变量则表示每日的新冠病毒检测阳性率。通过这些数据,研究者可以分析疫情的传播速度和检测效率;政策制定者可以据此调整公共卫生措施,以更好地控制疫情。
数据获取方法:
数据集中前22个变量的数据来自马来西亚卫生部@DGHisham账号的推文,通过Python/Pandas进行数据清洗,并利用正则表达式提取数值。缺失数据通过马来西亚卫生部官网和脸书等渠道补充。第23个变量“remark”为作者对推文状态和内容的注释。第24个变量“Cumulative people tested”数据则来自马来西亚卫生部官网的每日疫情更新页面,特定情况下也使用卫生部危机准备与应对中心(CPRC KKM)的Telegram和Facebook Live视频中的数据。
数据集持续更新,每日更新一次。用户可以访问Tableau Public上的简单可视化仪表板,查看最新的疫情数据和可视化图表。未来将添加更多的图表以提供更全面的分析视角。
数据集的建立旨在为马来西亚民众提供更易于理解的新冠疫情信息,同时为数据科学社区提供更多的分析机会。