数据集 - 海数据

数字人文语言差距研究补充数据集

2025年12月19日 30 184 105

数据集概述本数据集是论文《数字人文中的语言差距：LLM辅助SKOS词表翻译》的补充数据，包含用于评估自动化SKOS词表翻译工具WOKIE的原始及翻译后的词表，覆盖考古学、文化时期等五个主题领域，以及本体匹配结果。文件详解该数据集由多个主题文件夹和结果文件夹组成，具体说明如下： - 主题词表文件夹（共五个）： -...

ZIP

古希腊与拉丁语翻译对齐标注指南及黄金标准数据集

2025年12月14日 30 33 29

数据集概述本数据集包含古希腊文本与拉丁语学术翻译对齐的标注指南及黄金标准，涵盖100条随机选自Digital Fragmenta Historicorum Graecorum的片段，由专家手动对齐，标注者间一致性达90.5%，可用于翻译对齐任务的执行、评估及模型训练。文件详解核心文件：...

ZIP

数字人文语言鸿沟研究补充数据集

2025年12月13日 30 161 43

数据集概述本数据集是论文《Mind the Language Gap in Digital Humanities: LLM-Aided Translation of SKOS...

ZIP

新闻文本机器翻译质量评估指标数据集

2025年11月27日 30 46 17

数据集概述该数据集包含英文新闻文本经四种机器翻译系统（谷歌统计/神经翻译、MT@EC统计翻译、E-Translation神经翻译）译为斯洛伐克语后的自动评估指标值，涵盖PER、WER、TER、CDER、BLEU等核心翻译质量指标，用于自动化评估机器翻译结果。文件详解文件名称: Data.txt 文件格式: TXT 字段映射:...