数据集

教育不公平不平等性AI公平性研究基准数据集

数据集概述

本数据集是专为教育领域AI公平性研究设计的基准数据集，包含处理后数据集、缺失值掩码、元数据等文件，支持提升学生表现、降低辍学率的公平性AI方案开发，推动教育公平。

文件详解

数据集包含一个ZIP压缩文件，内部目录结构及文件说明如下： - 根目录文件：students-dataset.zip（ZIP格式），压缩包内包含以下目录及文件： - benchmark/目录： - dataset.csv：处理后的核心数据集 - missing_mask.csv：缺失值处理掩码文件 - meta_cols.csv：含学生分组标准与样本权重的元数据列文件 - raw_data/目录： - original.csv：原始数据集 - split/、pre_processed/、validation/：预处理与验证流程的中间阶段数据 - res/目录： - meta_data_mapping.csv：原始数据集列与处理后列的映射、缺失类别及原文说明 - meta_data_stats.json：处理后数据集各列的数值类型与值域 - bias_preservation_results.json：验证流程的统计指标 - src/目录： - pre_processing/、stats/：预处理与分析任务的代码目录 - pre_processing.py、split.py：预处理与数据拆分的入口代码文件 - Dockerfile、requirements.txt：环境配置文件

适用场景

AI公平性研究：用于开发与评估教育领域无偏见的AI模型
教育数据分析：分析学生表现与辍学率的公平性影响因素
教育政策支持：为制定促进教育公平的政策提供数据依据
算法偏见检测：验证AI模型在教育场景中的公平性表现

数据与资源

15546688.zipZIP
109.71 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	109.71 MiB
最后更新	2025年12月5日
创建于	2025年12月5日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。