数据集概述
本数据集为柏拉图《克里托篇》(Crito)的多语言句对齐翻译语料,包含原始古希腊文(Burnet版本)及对应翻译:5份波斯语学生翻译、2份英语翻译(Jowett版、Fowler版)、1份德语翻译(Schleiermacher版)。数据支持多语言翻译对齐研究,共3个文件。
文件详解
- 文件名称:Translations of Crito by students.xlsx
- 文件格式:XLSX
- 字段映射介绍:包含句对齐的多语言翻译数据,涉及字段包括句子编号、古希腊文原文、Fowler英译本、Jowett英译本、Schleiermacher德译本及5位波斯语学生译本(Rahimi、Nikpour、Mohammadi、Mahmoudzadeh、Assimi)
- 文件名称:Translations of Crito by students.json
- 文件格式:JSON
- 字段映射介绍:结构化存储的多语言句对齐翻译数据,字段与XLSX文件一致
- 文件名称:Translations of Crito by students.tsv
- 文件格式:TSV
- 字段映射介绍:制表符分隔的多语言句对齐翻译数据,字段包含句子编号、Greek(古希腊文)、Fowler(英译本)、Jowett(英译本)、Schleiermacher(德译本)及5位波斯语译者译本列
数据来源
Perseus Digital Library、Project Gutenberg、Internet Classics Archive、Ugarit平台
适用场景
- 多语言翻译对齐研究:分析不同语言译本与古希腊文原文的句级对齐关系
- 古典文献翻译教学评估:评估学生波斯语翻译的准确性与差异
- 自然语言处理模型训练:用于多语言机器翻译、跨语言对齐模型的训练与验证
- 古典哲学文本跨语言对比:对比不同语言译本对柏拉图《克里托篇》核心思想的传达差异