数据集概述
本数据集是PubFig83数据集的子集,包含5位名人(詹妮弗·洛佩兹、凯瑟琳·海格尔、斯嘉丽·约翰逊、玛丽亚·凯莉、杰西卡·阿尔芭)的人脸图像,每位名人各100张。数据集用于不平衡数据分类的遗传算法集成组合搜索研究,包含原始图像及特征处理后的子集。
文件详解
- PubFig05.docx
- 文件格式:DOCX
- 字段映射介绍:描述数据集的构建过程、特征提取(HT-L3模型提取25600个特征)、特征选择方法(熵过滤、类分布平衡、(alpha,beta)-k特征选择)及实验细节。
- pibfig05_dataset.tar.gz
- 文件格式:GZ(压缩包)
- 字段映射介绍:包含5位名人的人脸图像数据,每位名人90张训练图像、10张测试图像,以及经特征处理后的二进制分类数据集(UAB、IAB、UEAB三种特征选择结果)。
数据来源
论文“Heterogeneous Ensemble Combination Search using Genetic Algorithm for Class Imbalanced Data Classification”
适用场景
- 不平衡数据分类研究:分析遗传算法集成组合在人脸分类任务中的性能。
- 特征选择方法评估:对比熵过滤、(alpha,beta)-k等特征选择方法对分类效果的影响。
- 人脸特征提取研究:基于HT-L3模型的特征提取结果,探索人脸图像特征的表达能力。
- 集成学习算法优化:验证遗传算法在集成组合搜索中的有效性。