数据集概述
本数据集包含用于视觉实体隐私学习研究的精选图像隐私数据集及预计算视觉实体。涵盖PicAlert、VISPR、PrivacyAlert等原始数据集的整理版本,图像来自Flickr,标注为公开或私有二元标签,存在公开类高不平衡性,支持灵活数据拆分与模型训练。
文件详解
- 精选图像隐私数据集:
- 包含PicAlert、VISPR、PrivacyAlert数据集的整理版本,通过bash脚本提供Flickr图像下载链接及重组脚本
- 标注文件统一管理训练/验证/测试拆分,支持分层K折交叉验证,避免拆分文件夹分离
- 预计算视觉实体文件(均为.zip格式):
- scenes_VISPR.zip:VISPR数据集的场景概率预测CSV文件
- objects_privacyalert.zip:PrivacyAlert数据集的COCO格式目标检测JSON文件
- objects_picalert.zip:PicAlert数据集的COCO格式目标检测JSON文件
- scenes_picalert.zip:PicAlert数据集的场景概率预测CSV文件
- scenes_privacyalert.zip:PrivacyAlert数据集的场景概率预测CSV文件
- graphdata_picalert.zip:PicAlert数据集的图格式节点特征JSON文件及邻接矩阵
- objects_VISPR.zip:VISPR数据集的COCO格式目标检测JSON文件
- graphdata_IPD.zip:IPD数据集的图格式节点特征JSON文件及邻接矩阵
适用场景
- 视觉隐私分类模型训练与验证
- 不平衡数据集处理方法研究
- 图神经网络在视觉实体隐私分析中的应用
- 分层K折交叉验证策略在图像隐私任务中的效果评估
- 公开图像隐私标注一致性与鲁棒性分析