捷克波西米亚历史文献转录超级模型数据集2024

数据集概述

该数据集记录了2024年学生资助竞赛(SGS)项目中,学生团队基于Transkribus平台开发的捷克历史文献转录模型成果。包含训练集、验证集的错误率数据,多个学生开发的转录模型(如Finale 2.0、Agreg-8)及其字符错误率(CER),以及最终聚合模型CZECH supermodel_SGS的性能指标,为历史文献自动转录技术研究提供参考。

文件详解

  • metadata.xml:XML格式元数据文件,可能包含数据集的基本描述信息
  • Copy_of_HTR_Train_Set_'CZECH_supermodel_SGS'.pdf:PDF格式文件,HTR训练集相关文档
  • Copy_of_HTR_Train_Set_'CZECH_supermodel_SGS'.docx:DOCX格式文件,HTR训练集相关文档
  • mets.xml:XML格式文件,可能为元数据编码规范相关文件

数据来源

Študentské grantové súťaže (SGS)

适用场景

  • 历史文献数字化研究:用于分析手写历史文献自动转录模型的性能与优化方法
  • 教育实践评估:评估学生在历史文献转录技术学习中的成果与技能掌握情况
  • 自然语言处理应用:为低资源语言(捷克语)手写文本识别模型的开发提供数据支持
  • 文化遗产保护:探索自动化技术在历史文献整理与保存中的应用价值
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 336.79 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。