-
Gumpenhuber_2024_数字化手稿数据
2026年1月31日 30 32 16
数据集概述 本数据集包含Philipp Gumpenhuber(1706–1770)1758、1759及1761–1763年手写编年史的数字化转录数据,涵盖其记录的戏剧、音乐作品及芭蕾表演细节。数据经Transkribus转录,2024年由Lisa Rosendahl为DFG项目“Tanz/Musik...
-
UU15755_Based_荷兰联省共和国及省份法令集第八卷_1795
2026年1月26日 30 200 12
数据集概述 本数据集为荷兰法令集第八卷(Groot placaet-boeck Volume 8)的转录数据,收录了荷兰联省共和国、荷兰与西弗里西亚省、泽兰省的法令、条例及敕令,由Johannes Allart于1795年在阿姆斯特丹出版。数据基于荷兰国家图书馆馆藏副本转录,包含原始法令文本及相关元信息。 文件详解 文件名称:UU15755.zip...
-
GreetingsFrom_Based历史明信片地址转录数据集2023
2026年1月22日 30 144 11
数据集概述 本数据集包含500张具有历史意义的明信片背面的地址转录数据,覆盖比利时、法国、德国、卢森堡、荷兰和英国六个国家。数据集提供人类标注的Ground Truth(GT)和手写文本识别(HTR)两种转录版本,用于历史明信片地址信息的提取研究。 文件详解 GreetingsFrom_GT.zip 文件格式:ZIP...
-
Entangled_Histories_佛兰德斯议会法令集转录数据集_1787
2026年1月20日 30 73 13
数据集概述 本数据集为1787年出版的《佛兰德斯议会法令、公告、特许状等汇编及国务委员会相关判决》第6卷的转录版本。内容包括佛兰德斯议会登记的官方文件及特定管辖范围内的国务委员会判决,是研究18世纪佛兰德斯地区法律与行政历史的重要原始文献。 文件详解 文件名称:OXFORD555082878.zip 文件格式:ZIP...
-
UBL000039737_KB_基于荷兰低地国家法令文献的转录数据集_纠缠的历史项目
2026年1月18日 30 103 101
数据集概述 本数据集为荷兰低地国家法令文献的转录数据,对应1639年出版的《Placcaeten, ordonnantien...》第8卷。数据由“Entangled Histories”项目生成,基于莱顿大学图书馆馆藏副本的数字化版本,采用Transkribus和Abbyy FineReader工具转录,包含缩写展开、保留行末连字符等规范处理。...
-
Transkribus_Scholarship_Based_数字人文平台研究多样性评估数据集
2026年1月17日 30 3 0
数据集概述 本数据集为Transkribus奖学金项目(2020年11月至2022年3月)的匿名化自动邮件数据,旨在支持手写文本识别(HTR)相关研究,涉及学生、工作坊负责人及青年研究人员(ECRs)。数据用于分析数字人文平台是否促进研究多样性,仅包含一个文件。 文件详解 文件名称:Anonymised Transkribus Scholarship...
-
Transkribus_HTR_Software_遗产语境手写文本识别技术应用分类数据
2026年1月14日 30 28 1
数据集概述 本数据集为系统综述论文的附录A,记录了所有提及手写文本识别(HTR)软件Transkribus的分类研究成果,支撑“遗产语境下手写文本识别技术应用”主题的系统性分析,包含1份文档文件。 文件详解 文件名称:Appendix A - Understanding the application of Handwritten Text...
-
Noscemus_Transkribus_Based_早期现代拉丁印刷品机器可读文本数据
2026年1月13日 30 44 22
数据集概述 本数据集包含从Noscemus Wiki收录的作品数字副本中提取的纯文本,通过Transkribus工具转换为机器可读格式。文本通过Transkribus ID相互关联,每个数字副本的来源均有记录。转录文本由NOSCEMUS项目训练的早期现代拉丁印刷品识别模型自动生成,未经过人工编辑或校正,共包含1个文件。 文件详解...
-
Transkribus_Based_约翰_克里索斯托姆讲道手稿列表及人工转录数据_V1_2
2026年1月13日 30 181 107
数据集概述 本数据集包含用于Transkribus手写文本识别(HTR)训练实验的约翰·克里索斯托姆《提多书讲道》手稿列表及人工转录样本。手稿年代为10至14世纪,数据集提供CSV格式的手稿清单及TEI标准格式的XML人工转录文件,支持HTR模型训练的基础数据需求。 文件详解 文件名称:sample_dataset-chrysostomus-...
-
UBL000034544_基于_神圣罗马帝国法律习俗文献_的数字化转录数据_纠缠的历史项目
2026年1月12日 30 124 31
数据集概述 本数据集为1620年出版的荷兰语文献《Keyserlicke statvyten...》的数字化转录结果,文献内容围绕神圣罗马帝国的法规、条例、习俗及各城市权利展开。转录基于莱顿大学图书馆馆藏副本,经荷兰国家图书馆数字化,使用Transkribus和Abbyy FineReader工具处理,包含1个压缩文件。 文件详解...
-
霍夫日记_萨克森王位继承人约翰_乔治二世的宫廷记录_TEI_XML_转录数据_1653_1656年
2026年1月7日 30 192 150
数据集概述 本数据集为萨克森选帝侯Johann Georg II.(1653-1656年任王储时期)宫廷日记手稿的TEI:XML转录版本,记录其父Johann Georg I.最后三年统治期间的权力交接过程。转录经Transkribus行分割、scriptorium模型训练、LLM校正及人工核验,遵循DTABf-M规范,含日期、人物、地点等结构化标记。...
-
KBNLB410017188_KB_Based_Over_Yssel土地权利文献转录数据_纠缠的历史项目
2025年12月31日 30 118 52
数据集概述 本数据集是1634年出版的荷兰Overijssel省土地权利文献《Landtrechten van Over-Yssel》的转录数据,源自荷兰国家图书馆(KB)馆藏副本。通过Transkribus和Abbyy FineReader工具处理,遵循特定转录规范,为研究荷兰早期现代土地法提供结构化文本资源。 文件详解...
-
KBNL03000040140_Entangled_Histories_乌得勒支地区公告集转录数据1856
2025年12月31日 30 209 115
数据集概述 本数据集为《Mr. Johan van de Water's Groot plakkaatboek 'slands van...
-
GENT900000122888_基于1431至1785年南尼德兰贵族头衔与荣誉标志的历史文献汇编_转录版
2025年12月30日 30 13 1
数据集概述 本数据集为1431年至1785年5月南尼德兰地区贵族头衔与荣誉标志相关官方文献的编年汇编转录数据,包含公告、敕令、法令、条例、指令及条约等,主要来自原始版本收集,由布鲁塞尔出版商Jos. Ermens于1785年出版,转录基于根特大学馆藏副本。 文件详解 文件名称:GENT900000122888.zip 文件格式:ZIP...
-
GENT900000165290_Entangled_Histories_卢森堡与希尼伯爵领地法规汇编数据1691
2025年12月27日 30 148 65
数据集概述 本数据集为1691年出版的《卢森堡公国及希尼伯国敕令、条例、声明与规章汇编》(Recueil d'édits...)的转录数据,由Ghent University所藏版本转录而来,属于“纠缠历史”(Entangled Histories)项目成果,主要记录该时期两地的法律与行政文件内容。 文件详解...
-
捷克波西米亚历史文献转录超级模型数据集2024
2025年12月14日 30 9 0
数据集概述 该数据集记录了2024年学生资助竞赛(SGS)项目中,学生团队基于Transkribus平台开发的捷克历史文献转录模型成果。包含训练集、验证集的错误率数据,多个学生开发的转录模型(如Finale 2.0、Agreg-8)及其字符错误率(CER),以及最终聚合模型CZECH...
-
基督教阿拉伯文手写文本识别模型训练数据集
2025年12月10日 30 81 74
数据集概述 本数据集包含基督教阿拉伯文手稿的图像及专家校正的分割、转录数据,以PAGE XML格式存储,用于训练和测试Agapet手写文本识别模型,兼容Transkribus、eScriptorium/Kraken等工具。 文件详解 文件名称: Sin423 (17th cent).zip:ZIP格式压缩包,包含17世纪Sinai Arabic...
-
希腊议会二战后会议记录分析与识别数据集1946_1947
2025年12月5日 30 21 19
数据集概述 该数据集通过文本识别与自然语言处理技术,解锁1946-1947年希腊议会会议记录的历史语料。包含经Transkribus训练的文本识别模型处理的3156张扫描图像,以及通过语言模型优化、信息提取技术分析的演讲数据,首次量化了获得掌声的议题。 文件详解 文件名称: README.md,文件格式: Markdown,内容:...



