数据集概述
该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。
文件详解
- 文件名称: eng.txt
- 文件格式: TXT (.txt)
- 内容说明: 可能包含英语翻译文本内容,如文件预览示例中的《伊利亚特》开篇英文译文片段
- 文件名称: text_grc_eng.txt
- 文件格式: TXT (.txt)
- 内容说明: 可能包含古希腊语原文与英语翻译的文本集合
- 文件名称: grc-eng-goldstandards.json
- 文件格式: JSON (.json)
- 内容说明: 古希腊语-英语翻译对齐的黄金标准数据文件,用于评估对齐质量
- 文件名称: alignment_grc_eng.txt
- 文件格式: TXT (.txt)
- 内容说明: 可能记录古希腊语与英语文本的具体对齐关系数据
- 文件名称: guidelines_grc-eng.pdf
- 文件格式: PDF (.pdf)
- 内容说明: 古希腊语-英语翻译对齐的标注指南文档,包含对齐规则、流程及操作说明
- 文件名称: grc.txt
- 文件格式: TXT (.txt)
- 内容说明: 可能包含古希腊语原文文本内容
适用场景
- 古希腊语翻译对齐研究: 执行与评估不同古希腊语文本(如史诗、散文、对话)与英语译文的对齐工作
- 黄金标准语料构建: 基于指南创建新的古希腊语-英语翻译对齐黄金标准语料库
- 自动化翻译模型训练: 为古希腊语到英语的机器翻译模型提供训练数据与评估基准
- 历史语言对齐方法适配: 参考指南结构适配其他屈折语与综合语对(如拉丁语-英语)的翻译对齐
- 历史文本翻译研究: 为历史文本与现代译文的对齐提供方法论框架(需根据研究场景调整指南)