找到2个数据集

标签: 机器翻译模型

过滤结果
  • EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据

    2025年12月27日 30 77 16

    数据集概述 本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。 文件详解 文件名称:data.xlsx 文件格式:XLSX 字段映射介绍:包含EN-MNE、EN-...
    packageimg
  • Umsuka英语_祖鲁语平行语料库

    2025年12月8日 30 29 18

    数据集概述 该数据集是开源高质量英语-祖鲁语平行语料库,涵盖南非本土及国际英语语境,由专业译者翻译构建。包含10000组平行句对(各5000组双向翻译),并从每组中分离1000组作为评估集,祖鲁语评估集经双重翻译以计算人类水平BLEU分数。 文件详解 训练数据文件(CSV格式): zu-en.training.csv:祖鲁语-...
    packageimg