坦桑尼亚预处理数据集

坦桑尼亚预处理数据集 数据来源:互联网公开数据 标签:坦桑尼亚,贫困研究,人口统计,健康调查,金融包容性,社会经济分析

数据概述: 坦桑尼亚预处理数据集结合了两个数据来源的预处理数据,为深入理解坦桑尼亚的贫困状况提供了丰富的信息资源。数据集包括来自坦桑尼亚人口与健康调查(DHS)和金融包容性见解调查(FII Survey)的数据。具体内容包括:

  • 人口与健康调查(DHS)预处理数据:包含五个主要数据文件,分别是家庭数据、家庭成员数据、出生数据、聚类信息和地理信息(shapefile)。前三个文件包含了计算多维贫困指数所需的所有特征。家庭成员数据和出生数据包含参考ID,可用于将其与家庭数据文件中的特定家庭关联。聚类文件包含将每个家庭链接到特定聚类的信息,这些聚类可以进一步与地理位置信息关联。

  • 金融包容性见解调查(FII Survey)预处理数据:包含与开发金融剥夺指标相关的特征,如受访者是否有正式银行账户、是否有正式储蓄以及是否有获得正式借款服务的途径。

此外,数据集中还包括一些"_sjoin"文件,这些文件是内核中空间连接的中间步骤结果,由于某些原因在Kaggle服务器上无法运行空间连接操作,因此这些结果被本地保存并在后续步骤中读取。

数据用途概述: 该数据集适用于贫困研究、社会经济分析、金融包容性分析等场景。研究人员可以利用此数据集开发贫困和金融剥夺指标,了解贫困状况及其影响因素;政策制定者可以基于数据评估相关政策的有效性;非政府组织可以利用数据识别贫困人群,提供针对性的援助服务;数据科学家和学生可以使用该数据集进行学术研究和教育培训。

参考文档和资源: - DHS Program Terms of Use - Intermedia Terms of Use

数据来源: - The Demographic & Health Surveys Program, USAID - The Financial Inclusion Insights Program, Intermedia

灵感来源: 该数据集旨在用于Data Science for Good: Kiva Crowdfunding挑战赛。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.55 MiB
最后更新 2025年4月15日
创建于 2025年4月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。