新冠疫情社区传播与健康状况预测数据集COVID-19CommunitySpreadandHealthStatusPrediction-violet12367
数据来源:互联网公开数据
标签:新冠疫情,社区传播,健康状况,预测模型,流行病学,机器学习,时间序列分析,人口健康
数据概述:
该数据集包含与新冠疫情相关的社区传播数据和个人健康状况信息,旨在用于预测新冠病毒的传播趋势和评估疫情对个人健康的影响。主要特征如下:
时间跨度:数据未明确标注时间范围,可能为疫情期间的某个时间段或多次采样。
地理范围:数据覆盖美国各州,包括AL, AK, AZ, AR, CA, CO, CT, FL, GA, ID, IL, IN, IA, KS, KY, LA, MD, MA, MI, MN, MS, MO, NE, NV, NJ, NM, NY, NC, OH, OK, OR, PA, RI, SC, TX, UT, VA, WA, WV, WI等。
数据维度:数据集包含多种变量,包括:
id:样本唯一标识符。
AL-WI:各州数据,可能代表各州的疫情相关指标。
cli, ili, hh_cmnty_cli, nohh_cmnty_cli:与流感样疾病相关的指标,可能用于评估社区传播情况。
wearing_mask, travel_outside_state, work_outside_home, shop, restaurant, spent_time, large_event, public_transit:行为数据,可能反映社交距离、出行等对疫情传播的影响。
anxious, depressed, felt_isolated, worried_become_ill, worried_finances:心理健康相关指标。
tested_positive:新冠病毒检测结果,为预测目标变量。
cli1, ili1, hh_:可能为cli和ili指标在不同时间窗口的变动情况。
数据格式:CSV格式,包括sampleSubmission.csv、covidtrain.csv和covidtest.csv三个文件,便于数据分析和模型训练。
该数据集特别适用于新冠疫情传播预测、健康状况评估以及疫情对社会生活影响的研究。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于流行病学、公共卫生、社会学等领域的研究,例如疫情传播模型构建、个人健康状况预测、社会行为与疫情关联分析等。
行业应用:为公共卫生部门、医疗机构、保险公司等提供数据支持,用于疫情监测、风险评估、资源分配和健康管理等。
决策支持:支持政府和相关机构制定疫情应对策略,例如疫苗接种计划、社交距离措施、心理健康支持等。
教育和培训:作为流行病学、数据科学、机器学习等课程的实训材料,帮助学生和研究人员深入理解新冠疫情及其影响。
此数据集特别适合用于探索社区传播模式,预测个人感染风险,并评估疫情对健康和生活方式的影响,从而为制定有效的公共卫生策略提供数据支持。