数据2024_MT_LLM_英到斯洛文尼亚语翻译质量评估数据集

数据集概述

本数据集为大语言模型(LLM)与传统神经机器翻译(NMT)的评估任务制备,包含7个系统(3个MT系统、4个LLM AI助手)的英到斯洛文尼亚语翻译结果,原始源文本与翻译同步采集以避免数据泄漏。

文件详解

  • 翻译评估表格文件
  • 文件名称:dataset_source_translations_1.xlsx、dataset_source_translations_2.xlsx、dataset_source_translations_3.xlsx、dataset_source_translations_4.xlsx
  • 文件格式:XLSX
  • 字段映射介绍:包含英文源文本及7个系统(Google Translate、DeepL、SYSTRAN、ChatGPT、Gemini、Claude、Mistral Le Chat)的斯洛文尼亚语翻译结果,用于翻译质量评估对比。

适用场景

  • 机器翻译系统性能对比:评估MT系统与LLM AI助手在英到斯洛文尼亚语翻译任务中的质量差异
  • 翻译模型鲁棒性分析:基于同步采集的源文本,研究系统对未泄漏数据的翻译表现
  • 自然语言处理研究:为英到斯洛文尼亚语翻译任务的模型优化提供实证数据
  • 翻译工具选型参考:为用户选择英到斯洛文尼亚语翻译工具提供数据支持
packageimg

数据与资源

附加信息

字段
作者 Maxj
版本 1
数据集大小 0.07 MiB
最后更新 2026年1月28日
创建于 2026年1月28日
声明 当前数据集部分源数据来源于公开互联网,如果有侵权,请24小时联系删除(400-600-6816)。