大规模野生标记人脸数据集-2007-marvinluckianto

大规模野生标记人脸数据集-2007-marvinluckianto 数据来源:互联网公开数据 标签:人脸识别,图像识别,深度学习,计算机视觉,标记数据,面部对齐,数据集,研究

数据概述: 大规模野生标记人脸数据集(Labeled Faces in the Wild,简称LFW)是一个包含13,233张人脸图像的数据库,涉及5,749个人,旨在研究无约束条件下的面部识别问题。这些图像由维奥拉-琼斯人脸检测器检测和居中,并从互联网收集。在数据集中,有1,680个人有多于两张的不同照片。该数据集包含四个不同版本的LFW图像以及三种不同类型的“对齐”图像。研究表明,深度漏斗图像(deep-funneled images)在大多数面部验证算法中表现更佳,因此上传的数据集为深度漏斗版本。

数据集包含11个文件,其中lfw-deepfunneled.zip包含所有图像文件。其他10个文件是相关的元数据,有助于形成训练和测试集。图像文件格式为“lfw/姓名/姓名_xxxx.jpg”,其中“xxxx”是填充到四位数的图像编号。每张图像尺寸为250x250像素,通过OpenCV实现的维奥拉-琼斯人脸检测器进行检测和裁剪,并自动放大1.2倍以捕捉更多面部信息。

元数据包括: - lfwallnames.csv:包含数据集中每个人的姓名及其对应图像数量。 - lfwreadme.csv:全面的说明文件,解释如何使用各个.csv文件进行训练和测试,以及列的元数据信息。 - pairs.csv:包含用于10折交叉验证的成对随机分割数据,用于图像受限配置。 - people.csv:包含用于10折交叉验证的个人随机分割数据,用于无限制配置。 - matchpairsDevTest.csv 和 matchpairsDevTrain.csv:用于成对配置的测试和训练匹配对。 - mismatchpairsDevTest.csv 和 mismatchpairsDevTrain.csv:用于成对配置的测试和训练不匹配对。 - peopleDevTest.csv 和 peopleDevTrain.csv:用于个人配置的测试和训练集。

数据用途概述: 该数据集适用于面部识别研究、图像处理、机器学习模型开发等场景。研究人员可以使用此数据集进行面部识别算法的训练和测试;开发人员可以利用此数据集优化面部对齐技术;教育工作者可以将其用于教学演示和实践项目。数据集为面部识别和相关领域的研究提供了高质量的数据支持。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 112.95 MiB
最后更新 2025年5月10日
创建于 2025年5月10日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。