-
TRIDIS_Based_中世纪与近代早期多语言手稿手写文本识别模型数据11th_16th
2026年1月17日 30 46 18
数据集概述 本数据集包含TRIDIS手写文本识别(HTR)模型相关文件,该模型针对11-16世纪中世纪与近代早期多语言(拉丁语、古法语、古西班牙语)手稿设计,适用于法律、行政等纪实类手稿及文学、学术文献。数据集含模型文件与元数据,支持历史文本数字化与分析。 文件详解 文件名称:metadata.json 文件格式:JSON...
-
Corpus_Litterarum_Source_e_codices拉丁手稿字符标注数据集
2026年1月12日 30 147 130
数据集概述 本数据集是基于e-codices提供的Codices Sangallenses CSG 11和CSG 70两份拉丁手稿构建的行级字符标注数据集。包含2152行图像及44407条字符级标注(共73类),涵盖标准拉丁字母、缩写及抄写符号,采用半自动标注流程。数据按预定义的训练/验证/测试集划分,支持古文字学、手写文本识别及字符分割研究。...
-
苏格兰海关账簿手写文本识别模型V0_8
2025年12月19日 30 15 12
数据集概述 本数据集是基于Transkribus平台训练的手写文本识别(HTR)模型,训练数据来自苏格兰国家档案馆1660-1691年间的海关账簿,覆盖9个港口的631页历史文档,用于识别该时期苏格兰海洋商品出口记录。 文件详解 文件名称: Scottish customs books Training Set samples.zip 文件格式:...
-
Zenon纸草文献手写文本识别基准数据集
2025年12月19日 30 23 11
数据集概述 本数据集包含Zenon档案中纸草文献的基准数据,涵盖手写文本的外交转录内容,采用PageXML格式存储,适用于手写文本识别研究,共含五十九个文件,包含图片与XML两种格式。 文件详解 该数据集包含两种格式的文件,具体说明如下: - 图片文件(.jpg格式,共三十二个): -...
-
古诺尔斯语手稿HTR模型训练与测试数据集
2025年12月6日 30 126 41
数据集概述 本数据集包含用于古诺尔斯语手稿手写文本识别(HTR)模型的训练与测试数据,支持DH2025论文研究。数据以ZIP压缩包形式存储,分为训练数据和测试数据两个文件夹,包含手稿图像及对应的ALTO-XML标注文件。 文件详解 压缩包文件:bifrost_01.zip(ZIP格式),包含两个子文件夹...
-
NIOD战争信件手写文本识别模型数据集1935_1950
2025年12月6日 30 165 133
数据集概述 本数据集包含基于荷兰NIOD研究所1935-1950年战争信件档案训练的手写文本识别(HTR)模型,训练数据来自968份荷兰语手写信件的真实转录文本,涵盖儿童、士兵等多群体的私人通信,为手写历史文献数字化提供技术支持。 文件详解 文件名称: Examples_HTR_Model.zip 文件格式: ZIP 内容说明:...
-
德累斯顿宫廷日记手写文本识别真值数据集1653_1656
2025年12月6日 30 49 17
数据集概述 该数据集包含17世纪萨克森宫廷日记(1653-1656)的12页手写文本真值数据,采用典型的萨克森官方法式草书(Kanzleikurrent)书写,偶见混合字体。提供与原始图像对齐的转录文本及ALTO XML格式文件,适用于手写文本识别模型训练与验证。 文件详解 图像文件:...



