范妮_门德尔松致威廉_亨塞尔书信转录数据集

数据集概述

本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。

文件详解

  • 文件名称:1878144588.zip、1878121294.zip
  • 文件格式:ZIP压缩包
  • 内容说明:每个压缩包对应柏林国家图书馆的一个书信文件夹,包含:
  • 单页文件:每页1个PAGE或ALTO格式文件(含无文本页),记录页面布局与转录内容
  • 文件夹级TEI文件:基于PAGE文件生成,每封信封装于元素中

数据来源

柏林国家图书馆、柏林艺术大学

适用场景

  • 手写文本识别(HTR)模型训练:提供德国库伦特字体单手写体训练数据
  • 历史语言学研究:分析1829年亲密书信的语言特征与书信体交流模式
  • 传记研究:补充范妮·门德尔松及其家庭的生平资料
  • 数字人文应用:作为数字版本或语义标注的基础素材
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 2.64 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。