找到980个数据集

标签: 机器翻译

过滤结果
  • Ugarit_Based_阿尔特米多鲁斯_解梦_第五卷希腊_葡萄牙语对齐翻译数据_V2

    2026年1月14日   

    数据集概述 本数据集包含阿尔特米多鲁斯《解梦》第五卷的希腊原文与葡萄牙语译文对齐版本,涵盖95章正文及分为四部分的序言,共99个文件。数据基于Pack 1963年希腊文版本和2014年葡萄牙语译文修订版,通过Ugarit平台对齐,是巴西圣保罗州立大学数字古典学开放项目的一部分。 文件详解 对齐翻译文件(XML格式)...
    packageimg
  • PES_French_translation_Based_物理努力量表法语翻译数据与代码

    2026年1月13日   

    数据集概述 本数据集包含物理努力量表(Physical effort scale)法语翻译相关的数据与代码,共2个文件,无目录结构。数据用于支持该量表的法语版本应用,包含样本文件和代码文件,适用于相关实验场景的样本分析。 文件详解 文件名称:pes_french_effort_scale_sample2.Rmd 文件格式:.rmd 字段映射介绍:R...
    packageimg
  • Archaeology_Vocabulary_DEU_ENG_考古学德英双语术语对照数据

    2026年1月13日   

    数据集概述 本数据集为德英双语考古学词汇表,涵盖田野考古、建筑、陶器、方法、防御工事等主题。词汇经学术翻译场景验证,部分含参考文献,部分无直接对应译文。原始术语库整合自SDL Multiterm 2015及2017版本,经OpenRefine 3.1清洗,包含5个文件。 文件详解 考古学词汇表文件(Excel格式)...
    packageimg
  • Buddhist_Translators_Workbench_佛教梵语词汇资源词典数据集

    2026年1月13日   

    数据集概述 本数据集是为佛教梵语词汇资源“佛教翻译工作台”概念验证开发的词典数据,包含2012-2016年的9个XML文件,记录佛教梵语词汇相关信息,曾获美国国家人文基金会资助,现迁移至新平台。 文件详解 词典数据文件(共9个) 文件名称:vikalpa.xml、prasāda.xml、saṃkalpa.xml、vi√kḷp.xml、abhi-...
    packageimg
  • Monte_Carlo_Method_Based_机器翻译服务元测试蒙特卡洛方法伴随数据集

    2026年1月13日   

    数据集概述 本数据集是“机器翻译服务元测试蒙特卡洛方法”的伴随数据,基于原始数据集优化分析方法,针对中文、日文等亚洲语言采用字符级分割,重新计算BLEU和余弦相似度得分,提供更精准的机器翻译服务测试评估数据。 文件详解 文件名称:Dataset Part II.xlsx 文件格式:XLSX...
    packageimg
  • IN00619_Translation_DAHRSENA_PARDI_PLATES翻译文档

    2026年1月12日   

    数据集概述 本数据集为IN00619号文献《DAHRSENA的PARDI PLATES》的翻译文档,核心内容是对该古代文献的文本翻译,为研究相关历史、文化或语言提供基础资料。数据集仅包含一份翻译文件。 文件详解 文件名称:IN00619 translation.docx 文件格式:DOCX 字段映射介绍:文档为《DAHRSENA的PARDI...
    packageimg
  • dijak_Bilingual_Slovenian_Italian官方公报术语对应条目数据

    2026年1月12日   

    数据集概述 本数据集呈现斯洛文尼亚语术语“dijak(中学生)”与其意大利语对应词的双语对应条目,数据源自斯洛文尼亚共和国官方公报发布的2004-2024年斯洛文尼亚-意大利双语法律文本,含84篇出版物,涵盖学前及初等教育、奖学金相关内容,展示术语在官方话语中的使用场景、语义差异及翻译选择。 文件详解 文件名称:Bilingual...
    packageimg
  • LanguageStructure_Xavante_dicionario_葡萄牙语词典合并数据

    2026年1月11日   

    数据集概述 本数据集为Xavante语与葡萄牙语的双语词典数据,包含词典内容的合并处理结果,涉及内容修正与音频添加等优化工作,以单一JSON文件形式呈现,可用于语言翻译、词典研究等场景。 文件详解 文件名称:xavante_dictionary_merged.json 文件格式:JSON...
    packageimg
  • Mirmint_Marie_Skłodowska_Curie中世纪爱尔兰与冰岛文本19世纪翻译数据集

    2026年1月6日   

    数据集概述 本数据集为MIRMINT项目成果,记录19世纪爱尔兰、冰岛、丹麦学者对中世纪爱尔兰与冰岛文本的翻译情况,包含翻译文本的出版信息、译者与编辑信息等,用于研究19世纪中世纪文本翻译的选择逻辑与学术背景,共含4个文件。 文件详解 说明文档 文件名称:About the Mirmint Dataset.docx 文件格式:DOCX...
    packageimg
  • IN00617_Translation_Chalukya王朝Nagavardhana授予文书翻译数据

    2026年1月5日   

    数据集概述 本数据集包含IN00617号Chalukya王朝Nagavardhana授予文书的翻译文本,是一份关于古代印度Chalukya王朝历史文书的翻译资料,为研究该时期历史、政治及社会文化提供原始文献参考。 文件详解 文件名称:IN00617 Translation.docx 文件格式:DOCX...
    packageimg
  • EAMT2024_Pre_task_perceptions_机器翻译预任务感知与译员表现研究数据2024

    2026年1月1日   

    数据集概述 本数据集包含EAMT2024论文研究中收集的全部数据,涉及为期两周的纵向研究,记录了十一名译员的源文本、译后编辑译文、质量及生产率评分,以及译员的预任务感知数据,用于分析机器翻译对翻译质量和效率的影响及人机交互优化方向。 文件详解 文件名称:Pre-task perceptions dataset.xlsx 文件格式:XLSX...
    packageimg
  • EN_MNE_EN_THA_Authentic_human_translations_corpora_真实人类翻译语料库数据

    2025年12月27日   

    数据集概述 本数据集包含EN-MNE、EN-THA两个真实人类翻译语料库,数据按研究方法选取并处理了长度在100-150字符的句子对,用于翻译相关研究。数据集仅含一个文件,无目录结构及训练测试、数据标签等拆分。 文件详解 文件名称:data.xlsx 文件格式:XLSX 字段映射介绍:包含EN-MNE、EN-...
    packageimg
  • 俄语词义消歧语料库_RuSemCor

    2025年12月23日   

    数据集概述 该数据集是一个为俄语设计的词义消歧语料库,通过WordNet进行语义标注,属于链接开放数据云(LLOD cloud)资源。包含标注数据文件和语料库归档文件,支持自然语言处理领域的词义消歧研究。 文件详解 文件名称: sense_annotations.tsv 文件格式: TSV (.tsv) 字段映射:...
    packageimg
  • 艺术翻译语言层面分析数据集

    2025年12月21日   

    数据集概述 本数据集围绕艺术翻译的语言层面展开分析,核心内容为相关研究文档,为探究艺术翻译中的语言特征、翻译策略等提供资料支持。 文件详解 文件名称:Bakhridinova Etibor Adakhamovnavna.pdf 文件格式:PDF 内容说明:该文档聚焦艺术翻译的语言层面分析,具体内容需查阅文档获取。 适用场景...
    packageimg
  • 艺术文本中术语反映的特异性特征

    2025年12月20日   

    数据集概述 该数据集包含一篇探讨艺术文本中术语反映特异性特征的文档,聚焦于术语在艺术文本中的独特表现形式与功能,为相关研究提供理论分析资料。 文件详解 数据集包含一个PDF格式的文档文件,具体如下: - 文件名称: Makhmudova Dilafruz Alijonovna .pdf - 文件格式: PDF (.pdf) - 文件内容:...
    packageimg
  • 阿英德三种语言名词性句子比较分析数据集

    2025年12月20日   

    数据集概述 该数据集包含一篇关于阿拉伯语、英语和德语名词性句子的比较分析文档,旨在探索三种语言名词性句子的相似性与差异,为语言结构对比研究提供资料支持。 文件详解 文件名称:Kholmatova Elnura Sherali qizi.pdf 文件格式:PDF...
    packageimg
  • 同声传译实践要义

    2025年12月19日   

    数据集概述 该数据集包含一篇关于同声传译实践核心内容的PDF文档,围绕同声传译的实践本质展开,为理解同声传译的实际应用要点提供资料支持。 文件详解 文件名称:Daminov Navruz Kudratovich.pdf 文件格式:PDF(.pdf) 内容说明:该文档为关于同声传译实践本质的研究或论述资料,具体内容需查阅文档原文 适用场景...
    packageimg
  • 跨文化桥梁_阿卜杜拉乌夫_菲特拉特戏剧翻译及其对文学关系的影响

    2025年12月25日   

    数据集概述 本数据集聚焦阿卜杜拉乌夫·菲特拉特戏剧作品的翻译研究,探讨其在跨文化交流中对文学关系的影响,包含相关主题的研究文档。 文件详解 文件名称:Jurayeva Zulayxo Shamsidinovna.pdf 文件格式:PDF(.pdf) 文件内容:包含关于阿卜杜拉乌夫·菲特拉特戏剧翻译及文学关系影响的研究内容 适用场景...
    packageimg
  • 声景属性翻译项目数据集

    2025年12月18日   

    数据集概述 本数据集为声景属性翻译项目(SATP)的成果,包含27段伦敦城市公共空间的双耳音频录音、1段校准信号及多语言声景感知评估数据,覆盖18种语言、707名参与者的19,089条样本,用于耳机听觉实验与声景研究。 文件详解 文档文件: README.md:项目概述、录音位置、参与者信息等核心说明文档 README-...
    packageimg
  • 加里哈拉铭文翻译数据集

    2025年12月24日   

    数据集概述 本数据集提供加里哈拉铭文(Gairidhara Inscription)的翻译内容,该铭文位于加德满都,包含了铭文的翻译文档,为研究该铭文相关历史、文化信息提供数据支持。 文件详解 文件名称:IN02048 LXXIX Gairidhara (Kathmandu)...
    packageimg