美国县级COVID-19与种族-性别-贫困关联风险数据集
数据来源:互联网公开数据
标签:COVID-19, 美国县, 贫困, 种族, 性别, 健康不平等, 数据分析, 公共卫生
数据概述
本数据集旨在研究美国县级层面COVID-19疫情死亡率和发病率与种族、性别、贫困之间的关联。数据涵盖了美国各州县在疫情流行期间的关键社会经济指标,包括贫困率、种族人口分布、性别比例等。数据来源于多个权威机构,包括USA Facts、U.S. CDC、SAIPE、U.S. Census以及Policy Map等,并结合了2017年SMART-BRFSS(行为风险因素监测系统)的数据。
数据时间范围大致为COVID-19大流行期间,具体时间窗口根据各数据源有所不同,但主要聚焦于2020年及之后的疫情高峰期。数据集包含了超过60个字段,覆盖了美国所有县的详细信息,为分析COVID-19风险的分布及其与社会经济因素的关系提供了全面支持。
数据用途概述
该数据集适用于以下多种研究和分析场景:
- 公共卫生研究:
- 探索COVID-19死亡率和发病率与贫困、种族、性别之间的相关性。
- 分析美国县级层面的健康不平等现象,识别高风险群体。
-
为制定针对性的公共卫生干预措施提供数据支持。
-
政策制定:
- 为政府和卫生部门制定资源分配策略提供依据,重点关注贫困和少数族裔社区。
-
评估现有公共卫生政策的效果,并提出改进建议。
-
学术研究:
- 支持研究者开展跨学科分析,结合地理、社会学、经济学等多领域视角探讨疫情与社会经济因素的交互作用。
-
为博士论文、学术期刊论文提供高质量的实证数据。
-
数据可视化与教育:
- 帮助研究人员和公众通过可视化工具直观展示COVID-19疫情风险的分布,提升公众对健康不平等现象的认知。
-
适用于教育培训,帮助学生理解公共卫生研究中的数据驱动方法。
-
国际比较:
- 提供一个模板,用于在其他国家开展类似分析,探讨COVID-19风险与社会经济因素的关联。
数据字段概述(部分字段示例)
以下是一些关键字段的描述:
- County Name:美国县名称。
- State:所属州。
- Population:县总人口。
- Poverty Rate:贫困率。
- Race/Ethnicity Distribution:
- White: 白人比例。
- Black: 非裔比例。
- Hispanic: 西班牙裔比例。
- Asian: 亚裔比例。
- Gender Distribution:男性和女性人口比例。
- COVID-19 Cases:COVID-19累计确诊病例数。
- COVID-19 Deaths:COVID-19累计死亡人数。
- COVID-19 Case Rate:每10万人口的COVID-19发病率。
- COVID-19 Death Rate:每10万人口的COVID-19死亡率。
数据来源说明
本数据集的数据来自多个公开的权威来源,具体包括:
- USA Facts/U.S. CDC:提供COVID-19确诊病例和死亡数据。
- SAIPE/U.S. Census:提供贫困率和人口统计信息。
- Population Estimates/U.S. Census:提供各县的人口估算数据。
- Policy Map/NY Times/2017 SMART-BRFSS, U.S. CDC:结合社会经济和健康行为数据,用于丰富分析维度。
所有数据源的链接和详细说明可在数据集的文件描述中找到。
数据限制与改进方向
-
健康系统能力未考虑:当前模型未纳入县级卫生系统能力和预防性健康措施的覆盖范围。未来可补充相关指标,如医院床位数量、医疗资源分布等。
-
国际适用性:虽然数据集主要关注美国县级情况,但其分析框架可为其他国家提供参考,尤其是在健康不平等问题突出的地区。
-
数据更新:随着疫情发展,新增数据可进一步完善数据集,反映不同时间点的疫情风险变化。
-
多维度分析:结合更多社会经济指标(如教育水平、住房条件等),可更全面地理解COVID-19风险的驱动因素。
致谢
特别感谢以下人员和机构的支持:
- General Assembly Data Science:感谢2020年6月至8月期间的课程团队和同学,包括Andrew Worsely、Lydia Peabody,以及在整个项目中提供指导的Julian Hatwell。
- 数据来源机构:USA Facts、U.S. CDC、SAIPE、U.S. Census、Policy Map等,在数据开放和整合方面提供的支持。
该数据集旨在促进对COVID-19疫情与社会经济因素之间关系的深入研究,为公共卫生决策提供数据基础,同时也为学术界和公众理解健康不平等问题提供支持。