找到642个数据集

标签: 机器翻译

过滤结果
  • 眼科医学文本双语平行语料库

    2025年4月14日   

    眼科医学文本双语平行语料库 数据来源:互联网公开数据 标签:医学翻译,眼科,平行语料库,双语文本,机器翻译,领域特定数据 数据概述:...
    packageimg
  • 基于GPT-3的改写文章数据集

    2025年4月14日   

    基于GPT-3的改写文章数据集 数据来源:互联网公开数据 标签:GPT-3,文本改写,自然语言处理,摘要,引言,数据增强,机器翻译 数据概述: 本数据集包含由GPT-3语言模型改写的文章标题、摘要和引言部分。原始文章选自Assoc. Prof. Mehmet Erkut Erdem的Google Scholar页面,并通过GPT-3...
    packageimg
  • 埃维语-英语双语对照数据集

    2025年4月14日   

    埃维语-英语双语对照数据集 数据来源:互联网公开数据 标签:埃维语,英语,双语对照,自然语言处理,机器翻译,跨语言研究,文本挖掘 数据概述:...
    packageimg
  • 斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语-

    2025年4月14日   

    斯坦福问答数据集SQuAD泰米尔语翻译数据集-问答对-泰米尔语- 数据来源:互联网公开数据 标签:问答,SQuAD,泰米尔语,自然语言处理,机器翻译,文本分析,数据集,翻译 数据概述: 本数据集是针对“chaii -...
    packageimg
  • 印地语-英语音译数据集

    2025年4月14日   

    印地语-英语音译数据集 数据来源:互联网公开数据 标签:印地语,英语,音译,自然语言处理,文本分类,情感分析,机器翻译,跨语言分析 数据概述: 本数据集包含印地语与英语语言对的音译文本数据,旨在促进自然语言处理任务,如文本分类、情感分析和机器翻译。数据集涵盖了不同领域和主题的各种文本样本,从短语到长句不等。数据集中的每个条目由一对印地语-...
    packageimg
  • 摩洛哥阿拉伯语Darija语言任务与平行翻译数据集

    2025年4月14日   

    摩洛哥阿拉伯语Darija语言任务与平行翻译数据集 数据来源:互联网公开数据 标签:摩洛哥阿拉伯语, Darija, 机器翻译, 语言模型, 平行语料库, 自然语言处理, 多语言学习 数据概述:...
    packageimg
  • PHINC-平行印地英混合语社交媒体语料库用于机器翻译

    2025年4月14日   

    PHINC-平行印地英混合语社交媒体语料库用于机器翻译 数据来源:互联网公开数据 标签:印地英混合语,机器翻译,社交媒体,代码混合,自然语言处理,多语言处理,语料库 数据概述:...
    packageimg
  • 僧伽罗语-英语-新加坡英语翻译数据集

    2025年4月14日   

    僧伽罗语-英语-新加坡英语翻译数据集 数据来源:互联网公开数据 标签:僧伽罗语,英语,新加坡英语,翻译数据,语言学习,机器翻译,语言学研究 数据概述: 本数据集包含僧伽罗语、英语和新加坡英语之间的翻译文本,每行记录包括一段僧伽罗语原文及其对应的英语和新加坡英语翻译。数据集结构清晰,便于进行文本分析和处理,为语言研究和翻译技术开发提供了可靠的数据支持。...
    packageimg
  • 印度次大陆嘻哈歌曲创作与语言应用数据集

    2025年4月14日   

    印度次大陆嘻哈歌曲创作与语言应用数据集 数据来源:互联网公开数据 标签:嘻哈,歌词,创意写作,自然语言处理,机器翻译,情感分析,转录,印度,DHH,Desi Hip Hop 数据概述:...
    packageimg
  • Hinglish印地语-英语混合语机器翻译数据集

    2025年4月14日   

    Hinglish印地语-英语混合语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,文本生成,代码混合语言,Hinglish,印地语,英语,自然语言处理,语言学,数据集 数据概述: 本数据集(HinGE)旨在促进代码混合语言,特别是 Hinglish(印地语和英语的混合)的自然语言生成研究。数据集包含由人类生成的 Hinglish...
    packageimg
  • 小型英语到法语机器翻译数据集

    2025年4月14日   

    小型英语到法语机器翻译数据集 数据来源:互联网公开数据 标签:机器翻译,英语,法语,自然语言处理,翻译模型,训练数据,语言学习 数据概述:...
    packageimg
  • 神经机器翻译-玉刚数据集

    2025年4月14日   

    神经机器翻译-玉刚数据集 数据来源:互联网公开数据 标签:神经机器翻译,玉刚,语言模型,数据集,机器翻译,自然语言处理,翻译质量评估 数据概述: 本数据集包含约12,000个玉刚语言的 instructional...
    packageimg
  • 沃森翻译增强训练测试数据集

    2025年4月14日   

    沃森翻译增强训练测试数据集 数据来源:互联网公开数据 标签:自然语言处理,数据增强,翻译,机器翻译,文本对,假设检验,训练集,测试集,数据扩增,Augmentation 数据概述:...
    packageimg
  • 翻译数学问题数据集

    2025年4月14日   

    翻译数学问题数据集 数据来源:互联网公开数据 标签:数学问题,翻译, Bengali, English, 语言模型, 机器翻译, 取回增强生成, 少样本学习 数据概述:...
    packageimg
  • 欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语

    2025年4月14日   

    欧盟医疗健康领域多语言平行语料库数据集英语-葡萄牙语 数据来源:互联网公开数据 标签:机器翻译,医疗健康,平行语料库,英语,葡萄牙语,自然语言处理,欧盟,ELRC-Medical-V2,语言数据 数据概述: ELRC-...
    packageimg
  • 英伊博对照词典数据集

    2025年4月14日   

    英伊博对照词典数据集 数据来源:互联网公开数据 标签:英伊博翻译,词典,机器翻译,语言学,文本翻译 数据概述: 本数据集用于英伊博机器翻译,包含从英伊博翻译词典网站抓取的文本文件。数据集包括英文单词和对应的伊博文单词,并以CSV文件的形式提供了双语对照表,为英伊博翻译任务提供了基础数据支持。 数据用途概述:...
    packageimg
  • 孟加拉语对话摘要数据集英文翻译

    2025年4月14日   

    孟加拉语对话摘要数据集英文翻译 数据来源:互联网公开数据 标签:对话摘要, 孟加拉语, 自然语言处理, 机器翻译, 文本摘要, 语言数据, 翻译数据集 数据概述:...
    packageimg
  • 斯里兰卡Singlish与僧伽罗语对话数据集

    2025年4月14日   

    斯里兰卡Singlish与僧伽罗语对话数据集 数据来源:互联网公开数据 标签:Singlish,僧伽罗语,对话数据集,NLP,聊天机器人,机器翻译,语言学习,社会媒体分析,语言研究 数据概述:...
    packageimg
  • 数据1000对孟加拉语到俄语翻译数据集

    2025年4月14日   

    数据1000对孟加拉语到俄语翻译数据集 数据来源:互联网公开数据 标签:孟加拉语,俄语,翻译,语言学研究,机器翻译,语料库,双语系统,自然语言处理 数据概述:...
    packageimg
  • 多语言复杂问答数据集-涵盖8种语言

    2025年4月14日   

    多语言复杂问答数据集-涵盖8种语言 数据来源:互联网公开数据 标签:多语言,问答,自然语言处理,NLP,机器翻译,语言模型,数据集,复杂问题,文本分析 数据概述: 本数据集由Hugging Face...
    packageimg