EPARCHOS_古希腊手写文献数据集

数据集概述

该数据集源自约1500-1530年的希腊手写抄本(大英博物馆Addit. 6791号抄本子集),包含Antonius Eparchos与Camillos Zanettus两位作者的手稿,收录Hierocles、Matthaeus Blastares及Michael Psellos的文本,涵盖希腊小写手写体典型缩写、语标和连词。

文件详解

  • 文件名称: eparchos.zip
  • 文件格式: ZIP压缩包
  • 包含内容: 120页扫描手写文本页(含9285行文本、18809个单词、6787个独特单词),每页对应PageXML文件,标注文本区域多边形坐标、带转录文本的行/单词多边形坐标。

适用场景

  • 古文字学研究: 分析16世纪希腊小写手写体的书写特征与演变规律
  • 数字人文研究: 构建中世纪至后拜占庭时期希腊文献语料库,支持文本挖掘与语义分析
  • 手写文本识别(HTR)训练: 为古希腊手写体识别模型提供带标注的训练数据
  • 文献学研究: 对比分析不同时期希腊抄本中的缩写、语标使用习惯
  • 历史语言学研究: 探究16世纪希腊语词汇特征与文本传播模式
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 109.37 MiB
最后更新 2025年12月8日
创建于 2025年12月8日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。