Gwalther_Based手写体真实数据

数据集概述

本数据集是鲁道夫·格瓦尔特(1519-1586)手写体的真实数据,来源于其著作《Lateinische Gedichte》(1540-1580年)。数据包含142张图像及对应的转录文本,涵盖4037行、26088个单词,语言为拉丁语,可用于手写体识别研究。

文件详解

  • 文件名称:bullinger-digital/gwalther-handwriting-ground-truth-v1.0.zip
  • 文件格式:ZIP
  • 字段映射介绍:压缩包内包含142张手写体图像及对应的转录文本,图像来源于Zentralbibliothek Zürich的Ms D 152手稿,转录文本经过人工校对,修正了标点和大小写不一致问题。

数据来源

e-manuscripta平台(参考:Gwalther, Rudolf: Lateinische Gedichte. Zürich, 1540-1580. Zentralbibliothek Zürich, Ms D 152, https://doi.org/10.7891/e-manuscripta-26750 / Public Domain Mark)

适用场景

  • 手写体识别模型训练: 用于训练和优化中世纪拉丁语手写体的自动识别算法。
  • 历史文献数字化: 支持鲁道夫·格瓦尔特著作《Lateinische Gedichte》的数字化转录与保存。
  • 手写体特征分析: 研究16世纪欧洲学者手写体的书写风格、标点使用及大小写习惯。
  • 文献校对工具开发: 基于人工修正后的真实数据,开发历史文献转录的自动校对工具。
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 86.1 MiB
最后更新 2026年2月2日
创建于 2026年2月2日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。