数据集

RIDE网络校对工具评测补充文件集

数据集概述

本数据集为RIDE项目对Juxta Web Service、LERA和Variance Viewer三款网络校对工具的评测提供测试数据与结果文件，包含基于TEI格式的虚拟文本和《哈姆雷特》版本文本，以及三款工具生成的校对结果文件。

文件详解

该数据集包含12个文件，具体说明如下： - 测试数据集文件： - 虚拟文本文件（lorem-.xml）：基于填充文本构建的TEI格式虚拟文本，包含基础文本差异案例，如lorem-1.xml、lorem-2.xml - 《哈姆雷特》版本文件（hamlet-.xml）：来自莎士比亚四开本档案库（CC BY-NC 2.0）的TEI简化编码文本，如hamlet-1611.xml、hamlet-1625.xml、hamlet-1637.xml - 工具结果文件： - Juxta Web Service结果（result-juxta_hamlet.xml）：TEI-XML格式的《哈姆雷特》校对结果 - LERA结果（result-lera_.pdf）：PDF格式的校对结果，如result-lera_lorem.pdf、result-lera_hamlet.pdf - Variance Viewer结果（result-variance-viewer_.xml）：TEI-XML格式的校对结果，如result-variance-viewer_lorem.xml、result-variance-viewer_hamlet.xml - 配置文件： - variance-viewer_config.txt：Variance Viewer工具的额外配置文件

适用场景

数字学术编辑工具评测：用于评估Juxta Web Service、LERA和Variance Viewer的校对功能与结果质量
文本差异分析研究：基于虚拟文本和《哈姆雷特》版本数据，分析不同校对工具处理文本差异的能力
TEI编码实践：作为TEI格式文本处理的测试案例，验证编码标准在实际工具中的应用效果
数字人文工具开发：为开发新的文本校对工具提供对比基准数据集

数据与资源

3582919.zipZIP
0.38 MiB

下载

附加信息

字段	值
作者	Maxj
版本	1
数据集大小	0.38 MiB
最后更新	2025年12月6日
创建于	2025年12月6日
声明	当前数据集部分源数据来源于公开互联网，如果有侵权，请24小时联系删除(400-600-6816)。