数据集概述
本数据集包含2020至2024年哈萨克斯坦区域与定居点间的学生流动数据,涵盖年度转学学生总数,按来源地、目的地(区域及定居点层面)分类。数据经官方教育数据库汇总,含结构化表格、变量说明、可视化图表及数据处理代码,为教育流动研究提供支持。
文件详解
该数据集由多个文件和目录组成,具体说明如下:
- 数据文件(位于 Dataset/data/ 目录下):
- Table 1.csv、Table 2.csv、Table 3.csv、Table 4.csv、Table 5.rural_to_urban.csv、Table 6.urban_to_rural.csv: 共六个CSV格式表格,记录不同维度的学生流动数据,字段含入学年份、区域代码、区域名称、流动类型(如城乡流动)、学生数量等。
- Codebook.xlsx: Excel格式变量说明文件,解释数据集中所有字段的含义。
- 可视化文件(位于 Dataset/data/visualisations/ 目录下):
- 七个PNG格式图表,如 Figure 1. Aggregated net migration of students by Area and Year (Table 1).png、Figure 4. Urban-rural student migration by Year (Table 4).png 等,对应各表格呈现核心流动模式。
- 代码文件(位于 Dataset/code/ 目录下):
- main code.ipynb: Python代码文件,用于处理和分析原始数据。
- README.txt: 文本文件,分步说明数据处理方法论。
数据来源
哈萨克斯坦国家教育数据库(National Education Database, NEDB)
适用场景
- 教育政策研究: 分析区域间学生流动趋势,为教育资源配置提供依据
- 城市化研究: 探究城乡间学生流动特征,反映人口迁移与城市化关联
- 教育不平等分析: 识别学生流动中的区域差异,评估教育机会公平性
- 学校规划应用: 基于流动数据预测区域学校生源变化,辅助招生规划
- 数据方法学参考: 学习教育行政数据的聚合处理与可视化呈现方法