教育不公平不平等性AI公平性研究基准数据集

数据集概述

本数据集是专为教育领域AI公平性研究设计的基准数据集,包含处理后数据集、缺失值掩码、元数据等文件,支持提升学生表现、降低辍学率的公平性AI方案开发,推动教育公平。

文件详解

数据集包含一个ZIP压缩文件,内部目录结构及文件说明如下: - 根目录文件:students-dataset.zip(ZIP格式),压缩包内包含以下目录及文件: - benchmark/目录: - dataset.csv:处理后的核心数据集 - missing_mask.csv:缺失值处理掩码文件 - meta_cols.csv:含学生分组标准与样本权重的元数据列文件 - raw_data/目录: - original.csv:原始数据集 - split/、pre_processed/、validation/:预处理与验证流程的中间阶段数据 - res/目录: - meta_data_mapping.csv:原始数据集列与处理后列的映射、缺失类别及原文说明 - meta_data_stats.json:处理后数据集各列的数值类型与值域 - bias_preservation_results.json:验证流程的统计指标 - src/目录: - pre_processing/、stats/:预处理与分析任务的代码目录 - pre_processing.py、split.py:预处理与数据拆分的入口代码文件 - Dockerfile、requirements.txt:环境配置文件

适用场景

  • AI公平性研究:用于开发与评估教育领域无偏见的AI模型
  • 教育数据分析:分析学生表现与辍学率的公平性影响因素
  • 教育政策支持:为制定促进教育公平的政策提供数据依据
  • 算法偏见检测:验证AI模型在教育场景中的公平性表现
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 109.71 MiB
最后更新 2025年12月5日
创建于 2025年12月5日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。