PubFig05_Supporting_不平衡数据分类集成算法实验数据集

数据集概述

本数据集是PubFig83数据集的子集,包含5位名人(詹妮弗·洛佩兹、凯瑟琳·海格尔、斯嘉丽·约翰逊、玛丽亚·凯莉、杰西卡·阿尔芭)的人脸图像,每位名人各100张。数据集用于不平衡数据分类的遗传算法集成组合搜索研究,包含原始图像及特征处理后的子集。

文件详解

  • PubFig05.docx
  • 文件格式:DOCX
  • 字段映射介绍:描述数据集的构建过程、特征提取(HT-L3模型提取25600个特征)、特征选择方法(熵过滤、类分布平衡、(alpha,beta)-k特征选择)及实验细节。
  • pibfig05_dataset.tar.gz
  • 文件格式:GZ(压缩包)
  • 字段映射介绍:包含5位名人的人脸图像数据,每位名人90张训练图像、10张测试图像,以及经特征处理后的二进制分类数据集(UAB、IAB、UEAB三种特征选择结果)。

数据来源

论文“Heterogeneous Ensemble Combination Search using Genetic Algorithm for Class Imbalanced Data Classification”

适用场景

  • 不平衡数据分类研究:分析遗传算法集成组合在人脸分类任务中的性能。
  • 特征选择方法评估:对比熵过滤、(alpha,beta)-k等特征选择方法对分类效果的影响。
  • 人脸特征提取研究:基于HT-L3模型的特征提取结果,探索人脸图像特征的表达能力。
  • 集成学习算法优化:验证遗传算法在集成组合搜索中的有效性。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 101.84 MiB
最后更新 2026年1月22日
创建于 2026年1月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。