手写姓名识别数据集-2023年-crowdflower

手写姓名识别数据集-2023年-crowdflower 数据来源:互联网公开数据 标签:手写识别,姓名识别,图像数据,法国姓名,字符识别,数据集,AI技术,机器学习

数据概述: 本数据集包含超过125,000条手写姓名(包括名和姓)的图像链接及其人工转录结果。大部分姓名为法语,特别适用于研究手写字符识别中的重音符号处理问题。数据集由Crowdflower平台的Data For Everyone Library提供,免费供社区使用。

数据包含了以下字段: _unit_id:图像的唯一标识符 image_url:图像文件的路径,路径以"images/"开头 transcription:转录后的姓名(文本形式) first_or_last:该名称是名还是姓

此外,数据集还包括一个名为"images"的文件夹,其中存放了每个图像文件。

数据用途概述: 该数据集适用于手写字符识别、姓名识别、重音符号处理等研究领域。研究者可以利用此数据进行模型训练和测试,提高手写字符识别的准确度;教育机构可以将其用于教学实践,帮助学生理解字符识别技术。此外,数据集还适用于自然语言处理、信息检索等领域的相关研究。

packageimg

数据与资源

附加信息

字段
版本 1.0
数据集大小 1.62 MiB
最后更新 2025年4月22日
创建于 2025年4月22日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。