数据集

大规模野生标记人脸数据集-2007-marvinluckianto

大规模野生标记人脸数据集-2007-marvinluckianto 数据来源：互联网公开数据标签：人脸识别,图像识别,深度学习,计算机视觉,标记数据,面部对齐,数据集,研究

数据概述：大规模野生标记人脸数据集（Labeled Faces in the Wild，简称LFW）是一个包含13,233张人脸图像的数据库，涉及5,749个人，旨在研究无约束条件下的面部识别问题。这些图像由维奥拉-琼斯人脸检测器检测和居中，并从互联网收集。在数据集中，有1,680个人有多于两张的不同照片。该数据集包含四个不同版本的LFW图像以及三种不同类型的“对齐”图像。研究表明，深度漏斗图像（deep-funneled images）在大多数面部验证算法中表现更佳，因此上传的数据集为深度漏斗版本。

数据集包含11个文件，其中lfw-deepfunneled.zip包含所有图像文件。其他10个文件是相关的元数据，有助于形成训练和测试集。图像文件格式为“lfw/姓名/姓名_xxxx.jpg”，其中“xxxx”是填充到四位数的图像编号。每张图像尺寸为250x250像素，通过OpenCV实现的维奥拉-琼斯人脸检测器进行检测和裁剪，并自动放大1.2倍以捕捉更多面部信息。

元数据包括： - lfwallnames.csv：包含数据集中每个人的姓名及其对应图像数量。 - lfwreadme.csv：全面的说明文件，解释如何使用各个.csv文件进行训练和测试，以及列的元数据信息。 - pairs.csv：包含用于10折交叉验证的成对随机分割数据，用于图像受限配置。 - people.csv：包含用于10折交叉验证的个人随机分割数据，用于无限制配置。 - matchpairsDevTest.csv 和 matchpairsDevTrain.csv：用于成对配置的测试和训练匹配对。 - mismatchpairsDevTest.csv 和 mismatchpairsDevTrain.csv：用于成对配置的测试和训练不匹配对。 - peopleDevTest.csv 和 peopleDevTrain.csv：用于个人配置的测试和训练集。

数据用途概述：该数据集适用于面部识别研究、图像处理、机器学习模型开发等场景。研究人员可以使用此数据集进行面部识别算法的训练和测试；开发人员可以利用此数据集优化面部对齐技术；教育工作者可以将其用于教学演示和实践项目。数据集为面部识别和相关领域的研究提供了高质量的数据支持。

数据与资源

versions_20250401121504.zipZIP
112.95 MiB

下载

附加信息

字段	值
版本	1.0
数据集大小	112.95 MiB
最后更新	2025年5月10日
创建于	2025年5月10日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。