Credal_Dog_7_丰富标签分类数据集

数据集概述

本数据集是基于众包标注的犬类分类数据集,区别于传统硬标签分类数据,其标签包含不确定性与不精确性,采用信念函数理论建模,支持经典、概率、模糊及证据模型等多种机器学习方法。数据集含七个类别、七百条观测记录及四十三维特征(含原始图片)。

文件详解

数据集包含数据文件和额外文件,具体说明如下: - 数据文件(位于 data/ 目录下): - classes.csv:数据集类别信息 - X.csv:数据集特征 - X_512.csv:数据集五百一十二维特征向量 - X_pictures.csv:原始图片特征 - y.csv:丰富标签数据 - y_true.csv:真实标签数据 - 额外文件(位于 extra/ 目录下): - y_hard.csv:新众包活动中的硬标签数据 - DATA_imperfect.csv:众包活动中的不完美回答数据 - ITERATION_imperfect.csv:众包活动第二步的不完美回答数据 - EVENT_imperfect.csv:贡献者事件数据 - ID_imperfect.csv:贡献者ID数据 - DATA_perfect.csv:新众包活动中的精确回答数据

适用场景

  • 机器学习模型研究:用于比较硬标签模型与概率、模糊、证据等不确定性模型的分类性能
  • 众包标注质量分析:探究标注过程中不确定性对标签质量及模型效果的影响
  • 计算机视觉应用:基于原始图片特征开展犬类图像分类任务
  • 不确定性推理研究:验证信念函数理论在处理不精确标签数据中的有效性
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 107.6 MiB
最后更新 2025年11月26日
创建于 2025年11月26日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。