泰国居民收入预测调查数据集ThailandResidentIncomePredictionSurveyData-panupongkiaengkham
数据来源:互联网公开数据
标签:收入预测, 居民调查, 泰国, 经济分析, 机器学习, 地区划分, 职业状况, 数据挖掘
数据概述:
该数据集包含来自泰国居民的调查数据,旨在用于收入预测分析。主要特征如下:
时间跨度:数据未明确标明时间,可视为一次性的调查结果。
地理范围:数据覆盖泰国,包含不同地区、府(省)、县(区)、分区等地理信息。
数据维度:数据集包含多个维度的数据,包括:
id:居民唯一标识符。
地理位置信息:Area(区域)、SubDistrict(分区)、District(县/区)、Province(府/省)、Region(地区)。
职业状况:Q1_OccStatus(职业状态)、Q1_Occ(职业)、Q1_OccCode(职业代码)、Q1_OccInd(行业)、Q1_Occ_Year(工作年限)、Q1_OCC_A/B/C(职业相关细分)。
收入相关信息:Income(收入,作为目标变量)。
其他调查问题:Q2, Q3Num, Q3No, Q4_1至Q4_7, Q4Most, Q5_1至Q5_9B, Q5_TotalA, Q5_TotalB, Q7_1至Q7_7, Q8A, Q8_2A, Q8B, Q8_2B, Q9_1等,涵盖生活、消费、工作等方面。
数据格式:数据以CSV格式提供,包含train_target.csv、Train_data.csv和Test_data.csv三个文件,其中train_target.csv包含id和Income,Train_data.csv包含训练数据特征,Test_data.csv包含测试数据特征。
数据来源:数据来源于泰国相关的调查或社会经济研究项目,已进行初步的数据整理。
该数据集适合用于收入预测、社会经济分析、地区差异研究等。
数据用途概述:
该数据集具有广泛的应用潜力,特别适用于以下场景:
研究与分析:适用于经济学、社会学、统计学等领域的学术研究,如收入影响因素分析、不同地区收入差异研究等。
行业应用:可以为金融、保险、市场调研等行业提供数据支持,例如信用评估、市场潜力分析等。
决策支持:支持政府部门和社会组织进行政策制定,如精准扶贫、区域发展规划等。
教育和培训:作为数据分析、机器学习、统计建模等课程的实训材料,帮助学生和研究人员理解和应用数据。
此数据集特别适合用于构建收入预测模型,探索影响居民收入的各种因素,并为社会经济政策提供数据支撑。