找到20个数据集

标签: 中世纪手稿

过滤结果
  • HTR_Based_中世纪拉丁及法语手稿文档识别模型数据集

    2026年1月30日 30 2 1

    数据集概述 本数据集用于训练和评估适用于拉丁及法语中世纪文档手稿的手写文本识别(HTR)模型,包含12-15世纪的宪章、登记簿等手稿数据,涉及1855页、12万行文本及近100万字符,整合了Alcar-HOME、e-NDP、Himanis三个开源真实语料库,支持多语言多字体识别,可用于中世纪文献的数字化处理。 文件详解 GT_list:...
    packageimg
  • York_Gospels_Based_千年生物信息羊皮纸研究数据

    2026年1月28日 30 163 5

    数据集概述 本数据集包含约克福音书(York Minster Ms. Add. 1)中的生物信息数据,该福音书是少数幸存的征服前福音书之一。通过扩展非侵入性摩擦电采样技术eZooMS并结合DNA分析,首次记录了这部具有千年历史手稿中积累的丰富生物信息,涵盖材料选择、抄本构建及使用历史等方面。数据集包含1个文件。 文件详解...
    packageimg
  • Etymologiae_Based_并行共享注释网络节点边表数据

    2026年1月28日 30 49 9

    数据集概述 本数据集包含用于绘制和分析塞维利亚的伊西多尔《词源》第一卷注释手稿共现网络的节点表和边表,是Evina Stein论文研究的支撑数据。数据以两种表格形式呈现,旨在通过网络方法分析中世纪手稿注释的传播特征,解决传统研究方法在有机注释语料分析中的局限。 文件详解 文件名称:AppendixII_NodeTable.xlsx 文件格式:XLSX...
    packageimg
  • ORIFLAMMS_Based中世纪日期标注手稿转录数据集2022

    2026年1月27日 30 102 100

    数据集概述 本数据集包含101份中世纪日期标注手稿的数字图像转录内容,源自ANR ORIFLAMMS项目。数据以TEI-XML格式记录手稿文本的缩写与扩展形式,经修订后于2022年3月更新,包含文本、坐标、链接等多类型文件,支持中世纪手稿的文本与图像对齐研究。 文件详解 img文件夹 内容:含101张手稿扫描图像,图像标注有手稿 shelfmark...
    packageimg
  • 雅各布_特温格_冯_金霍芬博士研究基础上的编年史手稿数据库_存档版

    2026年1月27日 30 134 21

    数据集概述 本数据集为Jakob Twinger von Königshofen编年史已知手稿的数据库,源自2013-2017年在德国弗莱堡大学开展的博士研究,2020年随博士论文出版。数据包含手稿元数据及文本与手稿关联关系,共128条手稿记录、1220条内容关联条目,可通过nodegoat_ID关联,用于中世纪编年史手稿研究。 文件详解 压缩包文件...
    packageimg
  • 人_机器_文化_基于中世纪手稿的月工场景图像ICONCLASS标注数据集2023

    2026年1月19日 30 127 92

    数据集概述 本数据集包含柏林国家图书馆2023年6月至7月联合柏林自由大学举办的Datathon成果,对4部15-16世纪数字化手稿中的48幅月工场景图像进行标注,内容涵盖图像区域、主题的图像学解释及对应的ICONCLASS符号,支持TEI.XML和JSON两种格式。 文件详解 JSON格式标注文件(共4个)...
    packageimg
  • Scriptorium_Bulletin_codicologique手稿学公报数据

    2026年1月18日 30 140 33

    数据集概述 本数据集包含Scriptorium(手稿学公报)相关内容,以压缩文件形式提供,无其他子目录或文件拆分,主要用于手稿学领域的研究与参考。 文件详解 文件名称:Scriptorium - Bulletin codicologique.zip 文件格式:ZIP 字段映射介绍:压缩文件,具体内容需解压后查看,无公开的README或内容预览信息。...
    packageimg
  • Transkribus_Based_约翰_克里索斯托姆讲道手稿列表及人工转录数据_V1_2

    2026年1月13日 30 147 83

    数据集概述 本数据集包含用于Transkribus手写文本识别(HTR)训练实验的约翰·克里索斯托姆《提多书讲道》手稿列表及人工转录样本。手稿年代为10至14世纪,数据集提供CSV格式的手稿清单及TEI标准格式的XML人工转录文件,支持HTR模型训练的基础数据需求。 文件详解 文件名称:sample_dataset-chrysostomus-...
    packageimg
  • 创新知识_基于伊西多尔_塞维利亚作品的词源研究_早期中世纪拉丁手稿数据集_v2_3_4版本

    2026年1月12日 30 71 61

    数据集概述 本数据集为Excel格式的结构化数据表,记录了现存且已识别的所有中世纪早期西方拉丁手稿中包含塞维利亚的伊西多尔《词源》全文或部分文本的信息。涵盖手稿的起源地、出处、保存状况、创作年代、物质属性、文字、内容、显著特征、在线呈现及参考文献等维度,共收录五百零七份手稿(不同版本数量略有差异),时间跨度为公元七世纪至十一世纪上半叶。 文件详解...
    packageimg
  • Corpus_Litterarum_Source_e_codices拉丁手稿字符标注数据集

    2026年1月12日 30 2 1

    数据集概述 本数据集是基于e-codices提供的Codices Sangallenses CSG 11和CSG 70两份拉丁手稿构建的行级字符标注数据集。包含2152行图像及44407条字符级标注(共73类),涵盖标准拉丁字母、缩写及抄写符号,采用半自动标注流程。数据按预定义的训练/验证/测试集划分,支持古文字学、手写文本识别及字符分割研究。...
    packageimg
  • Multilingual_Dynamics_Based_中世纪佛兰德斯多语言文学手稿元数据_2024版

    2026年1月2日 30 199 127

    数据集概述 本数据集是“中世纪佛兰德斯多语言文学动态”项目的一部分,包含2539份现存中世纪佛兰德斯手稿(约1200-1500年)的元数据,涵盖荷兰语、法语和拉丁语文学文本,涉及手稿的基本信息、文本特征、来源、抄本学、装饰和书写体等6类主题,为研究该地区多语言文学文化的生产与接受提供基础数据。 文件详解 文件名称:Dataset...
    packageimg
  • Handschrift_Vanden_Stock_Based_中世纪荷兰语手稿II_116号XML原始数据

    2025年12月30日 30 126 111

    数据集概述 本数据集包含15世纪中世纪荷兰语杂集《Vanden Stock手稿》(比利时皇家图书馆馆藏编号II 116)的原始XML数据,是其外交版本的底层数据。该版本遵循MVN指南,由Peter Boot和Herman Brinkman开发,受Huygens研究所支持,以开放获取协议共享。 文件详解 原始XML数据文件 文件名称:vds.xml...
    packageimg
  • 邓斯坦主教微型画像三维可视化数据集

    2025年12月20日 30 160 127

    数据集概述 本数据集包含邓斯坦主教微型画像的三维可视化文件及配套缩略图,原作为英格兰东南部(坎特伯雷基督堂)的历史手稿插图,展现邓斯坦主教撰写《圣本笃会规》评注的场景,通过三维格式呈现二维图像难以显示的细节。 文件详解 三维模型文件: 0cba865839054f5788972f70cd3ccf9f.glb:GLB格式的三维模型文件,用于三维可视化展示...
    packageimg
  • 手稿迁移映射知识图谱数据集2021

    2025年12月16日 30 104 103

    数据集概述 该数据集是手稿迁移映射(MMM)项目将三个独立数据库整合为统一知识图谱的成果,基于MMM数据转换流程构建,支持通过公共SPARQL端点访问或Docker部署,为手稿迁移研究提供结构化关联数据。 文件详解 文件名称:mmm_data_v2.2.0.zip 文件格式:ZIP(.zip)...
    packageimg
  • 圣加仑修道院两份加洛林时期伊西多尔_词源_校订附录数据集

    2025年12月15日 30 97 74

    数据集概述 本数据集为一份校勘表,包含伊西多尔《词源》中带有批判符号的一百四十五处段落,并提供了与中世纪早期圣加仑修道院相关的五份手稿的异文读本,用于复现九世纪下半叶圣加仑修道院对《词源》的批判性校订工作。 文件详解 文件名称: Steinova_TwoCarolingianRedactions_appendix.pdf 文件格式: PDF...
    packageimg
  • 数据3D_查德福音书地毯式十字架页数据集

    2025年12月13日 30 132 78

    数据集概述 该数据集为公元约730年的《查德福音书》中“地毯式十字架”页的3D数字化资料,包含拉丁文本及威尔士语、古英语边注,涉及手稿抄本学特征与多版本数字化文件,支持中世纪手稿研究。 文件详解...
    packageimg
  • 中世纪手稿及其迁移SPARQL查询与结果数据集2021

    2025年12月10日 30 185 117

    数据集概述 本数据集包含2022年发表于《Digital Medievalist》的研究文章中提出的SPARQL查询(PDF格式)及对应查询结果(CSV格式),查询编号与文章一致。数据基于2021年12月17日Mapping Manuscript Migrations项目SPARQL端点的运行结果,为研究中世纪手稿迁移的知识图谱应用提供支持。 文件详解...
    packageimg
  • 希伯来手稿数字化项目_五卷书及相关文本三维模型数据集

    2025年12月9日 30 44 25

    数据集概述 本数据集包含1486年意大利希伯来手稿《五卷书》(含五卷轴、诗篇、约伯记及哈夫塔拉)的数字化资源,由大英图书馆希伯来手稿数字化项目建模,获波兰斯基基金会资助,含三维模型与预览图片。 文件详解 三维模型文件:d6ca51e05b9a4d52b6dc6092cb71093f.glb,GLB格式,为手稿的三维模型文件...
    packageimg
  • 古诺尔斯语手稿HTR模型训练与测试数据集

    2025年12月6日 30 97 90

    数据集概述 本数据集包含用于古诺尔斯语手稿手写文本识别(HTR)模型的训练与测试数据,支持DH2025论文研究。数据以ZIP压缩包形式存储,分为训练数据和测试数据两个文件夹,包含手稿图像及对应的ALTO-XML标注文件。 文件详解 压缩包文件:bifrost_01.zip(ZIP格式),包含两个子文件夹...
    packageimg
  • 巴黎圣母院教务会议登记册数字化协作项目中世纪手稿手写文本识别基准数据集1326_1504

    2025年12月5日 30 22 4

    数据集概述 本数据集为e-NDP项目产出的中世纪手稿手写文本识别(HTR)基准数据,包含1326-1504年巴黎圣母院教务会议登记册的512页标注内容,涵盖文本转录与版面分割信息,支持中世纪草书手写文本识别模型训练与评估。 文件详解 主压缩文件: e-NDP_dataset.zip: ZIP格式压缩包,包含数据集所有内容...
    packageimg