-
数字人文语言差距研究补充数据集
2025年12月19日 30 30 2
数据集概述 本数据集是论文《数字人文中的语言差距:LLM辅助SKOS词表翻译》的补充数据,包含用于评估自动化SKOS词表翻译工具WOKIE的原始及翻译后的词表,覆盖考古学、文化时期等五个主题领域,以及本体匹配结果。 文件详解 该数据集由多个主题文件夹和结果文件夹组成,具体说明如下: - 主题词表文件夹(共五个): -...
-
古希腊与拉丁语翻译对齐标注指南及黄金标准数据集
2025年12月14日 30 208 99
数据集概述 本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准,涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段,由专家手动对齐,标注者间一致性达90.5%,可用于翻译对齐任务的执行、评估及模型训练。 文件详解 核心文件:...
-
数字人文语言鸿沟研究补充数据集
2025年12月13日 30 10 5
数据集概述 本数据集是论文《Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS...
-
新闻文本机器翻译质量评估指标数据集
2025年11月27日 30 67 36
数据集概述 该数据集包含英文新闻文本经四种机器翻译系统(谷歌统计/神经翻译、MT@EC统计翻译、E-Translation神经翻译)译为斯洛伐克语后的自动评估指标值,涵盖PER、WER、TER、CDER、BLEU等核心翻译质量指标,用于自动化评估机器翻译结果。 文件详解 文件名称: Data.txt 文件格式: TXT 字段映射:...
-
文本翻译语言水平评估数据集TextTranslationLanguageLevelAssessment-alexistomascenteno
2025年5月9日 30 69 0
文本翻译语言水平评估数据集TextTranslationLanguageLevelAssessment-alexistomascenteno 数据来源:互联网公开数据 标签:文本翻译, 语言水平, 文本分类, 语言学习, 文本分析, 数据标注, 机器学习, 语料库 数据概述:...
-
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare
2025年4月29日 30 136 10
机器翻译模型评估数据集MachineTranslationModelEvaluationDataset-annieblare 数据来源:互联网公开数据 标签:机器翻译, 文本分析, 语言模型, 困惑度, ChrF评分, 翻译质量, 跨语言, 文本对齐 数据概述:...
-
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua
2025年4月29日 30 59 16
TEBE-RESAT俄语文本翻译任务数据集TEBE-RESATRussianTextTranslationDataset-dinhngoctua 数据来源:互联网公开数据 标签:机器翻译, 俄语, 文本翻译, 自然语言处理, 文本对齐, 语言模型, 翻译评估, 文本处理 数据概述:...
-
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak
2025年4月21日 30 24 16
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:...



