-
OJ_Samples_翻译结果与评估数据集
2026年2月2日 30 40 30
数据集概述 本数据集开源了小规模OJ样本及其翻译结果与评估结果,为相关实验提供基础数据支撑。数据集包含1个压缩文件,未划分训练测试集、数据标签集或原始处理集,具体内容可参考README.md。 文件详解 文件名称:oj_samples.zip 文件格式:ZIP...
-
MUST_LT_Based_学生翻译评估语料库数据_2023版
2026年1月28日 30 166 38
数据集概述 本数据集包含MUST-LT语料库中的学生翻译评估数据,用于搭配翻译研究。数据源自Vaičenonienė, J. 2023年关于MUST-LT学习者翻译语料库的搭配翻译案例分析研究,为翻译教学与研究提供实证数据支持。 文件详解 文件名称:MUST-LT studentų vertimai.docx 文件格式:DOCX...
-
数据2024_MT_LLM_英到斯洛文尼亚语翻译质量评估数据集
2026年1月28日 30 53 5
数据集概述 本数据集为大语言模型(LLM)与传统神经机器翻译(NMT)的评估任务制备,包含7个系统(3个MT系统、4个LLM AI助手)的英到斯洛文尼亚语翻译结果,原始源文本与翻译同步采集以避免数据泄漏。 文件详解 翻译评估表格文件...
-
ClinSpEn_CT_Based_平行英西生物医学术语数据_2022
2026年1月26日 30 121 12
数据集概述 本数据集为ClinSpEn-Clinical Terms子任务的样本、测试及背景数据,方向为西班牙语到英语(ES>EN)翻译。术语源自医学文献和临床记录,聚焦疾病、症状等类别,由专业医疗译者翻译修订,支持生物医学领域机器翻译系统开发与评估。 文件详解...
-
TradutorNós_Based_加利西亚语EMP多词表达自动翻译评估数据
2026年1月20日 30 82 9
数据集概述 本数据集用于评估TradutorNós翻译工具对加利西亚语多词表达(EMP)的翻译精度,包含加利西亚语到英语、西班牙语的翻译内容,仅含一个文件,便于快速获取和使用。 文件详解 文件名称:Conjunto de datos de traducción automática de la EMP en gallego con...
-
数字人文语言差距研究补充数据集
2025年12月19日 30 112 45
数据集概述 本数据集是论文《数字人文中的语言差距:LLM辅助SKOS词表翻译》的补充数据,包含用于评估自动化SKOS词表翻译工具WOKIE的原始及翻译后的词表,覆盖考古学、文化时期等五个主题领域,以及本体匹配结果。 文件详解 该数据集由多个主题文件夹和结果文件夹组成,具体说明如下: - 主题词表文件夹(共五个): -...
-
古希腊与拉丁语翻译对齐标注指南及黄金标准数据集
2025年12月14日 30 147 144
数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...
-
数字人文语言鸿沟研究补充数据集
2025年12月13日 30 49 39
数据集概述 本数据集是论文《Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS...
-
新闻文本机器翻译质量评估指标数据集
2025年11月27日 30 108 93
数据集概述 该数据集包含英文新闻文本经四种机器翻译系统(谷歌统计/神经翻译、MT@EC统计翻译、E-Translation神经翻译)译为斯洛伐克语后的自动评估指标值,涵盖PER、WER、TER、CDER、BLEU等核心翻译质量指标,用于自动化评估机器翻译结果。 文件详解 文件名称: Data.txt 文件格式: TXT 字段映射:...
-
文本翻译语言水平评估数据集TextTranslationLanguageLevelAssessment-alexistomascenteno
2025年5月9日 30 116 7
文本翻译语言水平评估数据集TextTranslationLanguageLevelAssessment-alexistomascenteno 数据来源:互联网公开数据 标签:文本翻译, 语言水平, 文本分类, 语言学习, 文本分析, 数据标注, 机器学习, 语料库 数据概述:...
-
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare
2025年4月29日 30 167 71
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐 数据概述:...
-
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua
2025年4月29日 30 37 14
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua 数据来源:互联网公开数据 标签:机器翻译, 俄语, 文本翻译, 自然语言处理, 文本对齐, 语言模型, 翻译评估, 文本处理 数据概述:...
-
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak
2025年4月21日 30 52 6
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:...



