找到4个数据集

标签: TEI格式

过滤结果
  • 范妮_门德尔松致威廉_亨塞尔书信转录数据集

    2025年12月14日 30 92 0

    数据集概述 本数据集包含范妮·门德尔松致丈夫威廉·亨塞尔的122封书信转录内容,源自柏林国家图书馆的两文件夹藏品,共250页、2240行文本,以PAGE、ALTO及基础TEI格式存储,支持历史书信研究与手写文本识别模型训练。 文件详解 文件名称:1878144588.zip、1878121294.zip 文件格式:ZIP压缩包...
    packageimg
  • WeGA数据包裹_Carl_Maria_von_Weber全集数字版

    2025年12月14日 30 69 31

    数据集概述 本数据集是Carl-Maria-von-Weber全集(Carl-Maria-von-Weber-Gesamtausgabe)的数字版,包含TEI和MEI格式文档。数据从内部WeGA TEI格式转换而来,符合TEI_all和mei_all标准,保留全部信息,内部引用通过URI实现。 文件详解...
    packageimg
  • MeSpEn平行语料库_医疗健康文献数据集

    2025年12月13日 30 188 109

    数据集概述 该数据集为西班牙语与英语医疗健康领域的平行语料库资源,整合了西班牙、拉丁美洲等地的生物医学、临床文献及患者健康信息,支持医疗机器翻译、多语言术语提取及西班牙语医疗自然语言处理组件开发。 文件详解 该数据集包含多个文件,具体说明如下: - 说明文档: - MedlinePlus-health-...
    packageimg
  • RIDE网络校对工具评测补充文件集

    2025年12月6日 30 60 32

    数据集概述 本数据集为RIDE项目对Juxta Web Service、LERA和Variance Viewer三款网络校对工具的评测提供测试数据与结果文件,包含基于TEI格式的虚拟文本和《哈姆雷特》版本文本,以及三款工具生成的校对结果文件。 文件详解 该数据集包含12个文件,具体说明如下: - 测试数据集文件: -...
    packageimg