古希腊语到英语翻译对齐标注指南与黄金标准数据集

数据集概述

该数据集包含古希腊语文本与英语翻译对齐的标注指南及黄金标准,标注覆盖荷马史诗、雅典散文、柏拉图对话等文本,经测试标注者间一致性达百分之八十及以上,可用于翻译对齐的执行、评估及自动化模型训练。

文件详解

  • 文件名称: eng.txt
  • 文件格式: TXT (.txt)
  • 内容说明: 可能包含英语翻译文本内容,如文件预览示例中的《伊利亚特》开篇英文译文片段
  • 文件名称: text_grc_eng.txt
  • 文件格式: TXT (.txt)
  • 内容说明: 可能包含古希腊语原文与英语翻译的文本集合
  • 文件名称: grc-eng-goldstandards.json
  • 文件格式: JSON (.json)
  • 内容说明: 古希腊语-英语翻译对齐的黄金标准数据文件,用于评估对齐质量
  • 文件名称: alignment_grc_eng.txt
  • 文件格式: TXT (.txt)
  • 内容说明: 可能记录古希腊语与英语文本的具体对齐关系数据
  • 文件名称: guidelines_grc-eng.pdf
  • 文件格式: PDF (.pdf)
  • 内容说明: 古希腊语-英语翻译对齐的标注指南文档,包含对齐规则、流程及操作说明
  • 文件名称: grc.txt
  • 文件格式: TXT (.txt)
  • 内容说明: 可能包含古希腊语原文文本内容

适用场景

  • 古希腊语翻译对齐研究: 执行与评估不同古希腊语文本(如史诗、散文、对话)与英语译文的对齐工作
  • 黄金标准语料构建: 基于指南创建新的古希腊语-英语翻译对齐黄金标准语料库
  • 自动化翻译模型训练: 为古希腊语到英语的机器翻译模型提供训练数据与评估基准
  • 历史语言对齐方法适配: 参考指南结构适配其他屈折语与综合语对(如拉丁语-英语)的翻译对齐
  • 历史文本翻译研究: 为历史文本与现代译文的对齐提供方法论框架(需根据研究场景调整指南)
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.5 MiB
最后更新 2025年12月15日
创建于 2025年12月15日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。