法国国家图书馆24428号法文手稿自动转录数据集

数据集概述

该数据集记录了使用Transkribus工具对法国国家图书馆24428号十三世纪法文手稿的自动转录工作,包含训练模型的报告及转录文本文件,为中世纪手稿数字化研究提供支持。

文件详解

  • 文件名称:Automatic Transcription of BnF ms fr 24428 with Transkribus.pdf
  • 文件格式:PDF
  • 内容:详细报告,包含手稿描述、转录原则、模型性能分析及未来工作说明
  • 文件名称:BNFfr24428_GT_23Jan21.txt
  • 文件格式:TXT
  • 内容:2021年1月23日阶段的训练用真实文本(GT)数据
  • 文件名称:BNFfr24428_GT_10Jun21.txt
  • 文件格式:TXT
  • 内容:2021年6月10日阶段的训练用真实文本(GT)数据
  • 文件名称:BNFfr24428_Omons_entiretranscript.txt
  • 文件格式:TXT
  • 内容:使用Omons模型生成的手稿完整转录文本
  • 文件名称:BNFfr24428_Omons2_entiretranscript.txt
  • 文件格式:TXT
  • 内容:使用Omons2模型生成的手稿完整转录文本

适用场景

  • 中世纪手稿数字化研究:分析自动转录技术对古文字识别的准确性
  • 历史文献学研究:基于转录文本开展十三世纪法文手稿内容分析
  • 人工智能模型训练:为手写文本识别(HTR)模型提供中世纪文字训练数据参考
  • 数字人文项目:支持手稿文本的开放获取与学术共享
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 3.9 MiB
最后更新 2025年12月14日
创建于 2025年12月14日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。