RIDE网络校对工具评测补充文件集

数据集概述

本数据集为RIDE项目对Juxta Web Service、LERA和Variance Viewer三款网络校对工具的评测提供测试数据与结果文件,包含基于TEI格式的虚拟文本和《哈姆雷特》版本文本,以及三款工具生成的校对结果文件。

文件详解

该数据集包含12个文件,具体说明如下: - 测试数据集文件: - 虚拟文本文件(lorem-.xml):基于填充文本构建的TEI格式虚拟文本,包含基础文本差异案例,如lorem-1.xml、lorem-2.xml - 《哈姆雷特》版本文件(hamlet-.xml):来自莎士比亚四开本档案库(CC BY-NC 2.0)的TEI简化编码文本,如hamlet-1611.xml、hamlet-1625.xml、hamlet-1637.xml - 工具结果文件: - Juxta Web Service结果(result-juxta_hamlet.xml):TEI-XML格式的《哈姆雷特》校对结果 - LERA结果(result-lera_.pdf):PDF格式的校对结果,如result-lera_lorem.pdf、result-lera_hamlet.pdf - Variance Viewer结果(result-variance-viewer_.xml):TEI-XML格式的校对结果,如result-variance-viewer_lorem.xml、result-variance-viewer_hamlet.xml - 配置文件: - variance-viewer_config.txt:Variance Viewer工具的额外配置文件

适用场景

  • 数字学术编辑工具评测:用于评估Juxta Web Service、LERA和Variance Viewer的校对功能与结果质量
  • 文本差异分析研究:基于虚拟文本和《哈姆雷特》版本数据,分析不同校对工具处理文本差异的能力
  • TEI编码实践:作为TEI格式文本处理的测试案例,验证编码标准在实际工具中的应用效果
  • 数字人文工具开发:为开发新的文本校对工具提供对比基准数据集
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.38 MiB
最后更新 2025年12月6日
创建于 2025年12月6日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。