找到660个数据集

标签: 机器翻译

过滤结果
  • 英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48

    2025年4月22日   

    英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine...
    packageimg
  • 越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar

    2025年4月22日   

    越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:...
    packageimg
  • 土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15

    2025年4月22日   

    土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15 数据来源:互联网公开数据 标签:情感分析,NLP,土耳其语,电影评论,用户反馈,数据集,交叉语言分析,机器翻译,数据科学 数据概述:...
    packageimg
  • 英语-孟加拉语多元化翻译数据集-2023年-golammostofas

    2025年4月22日   

    英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:...
    packageimg
  • 英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151

    2025年4月22日   

    英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151 数据来源:互联网公开数据 标签:机器翻译,NLP,自然语言处理,翻译,英语,马拉地语,seq2seq,神经机器翻译,数据集 数据概述:...
    packageimg
  • 英语-马拉雅拉姆语言翻译数据集-nihalthomas15

    2025年4月22日   

    英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:...
    packageimg
  • 跨语言问答数据集XQuAD印地语部分2019-nbroad

    2025年4月21日   

    跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-...
    packageimg
  • 跨语言问答数据集XQuAD多语言问答数据集-thedevastator

    2025年4月21日   

    跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:...
    packageimg
  • 林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak

    2025年4月21日   

    林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:...
    packageimg
  • 英法翻译数据集-英语至法语翻译项目-数据-通用

    2025年4月21日   

    英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-...
    packageimg
  • 电影字幕多语言平行数据集

    2025年4月20日   

    电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:...
    packageimg
  • 英语-达里贾双语数据集

    2025年4月20日   

    英语-达里贾双语数据集 数据来源:互联网公开数据 标签:机器翻译,双语语料库,摩洛哥阿拉伯语,达里贾,自然语言处理,翻译模型,语言学习 数据概述: 本数据集是一个社区驱动的双语语料库,由MAD-...
    packageimg
  • 英语-泰语平行语料库

    2025年4月20日   

    英语-泰语平行语料库 数据来源:互联网公开数据 标签:平行语料库,机器翻译,自然语言处理,英语,泰语,跨语言分析,文本对齐,翻译模型训练 数据概述: 本数据集是一个大型的英语-...
    packageimg
  • 电影评论及其法语翻译数据集

    2025年4月20日   

    电影评论及其法语翻译数据集 数据来源:互联网公开数据 标签:电影评论,IMDb,法语翻译,文本处理,情感分析,机器翻译,跨语言分析 数据概述: 本数据集基于Aditya、P.等人的IMDb电影评论数据集构建,包含多部电影的评论数据,每条评论对应一部特定电影。数据集经过清洗和规则化处理,以确保数据质量,并使用Google Translate...
    packageimg
  • Flickr8k图像日语翻译数据集

    2025年4月19日   

    Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:...
    packageimg
  • 印度语维基百科文章问答对数据集-问答生成-36-6k

    2025年4月19日   

    印度语维基百科文章问答对数据集-问答生成-36-6k 数据来源:互联网公开数据 标签:问答对,印度语,维基百科,自然语言处理,机器翻译,问答生成,文本数据,语言学习 数据概述:...
    packageimg
  • 多语言平行语料库数据集

    2025年4月19日   

    多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-...
    packageimg
  • 英语-印地语句子翻译数据集

    2025年4月17日   

    英语-印地语句子翻译数据集 数据来源:互联网公开数据 标签:语言翻译,英语,印地语,机器翻译,自然语言处理,双语句对,文本对齐 数据概述: 本数据集来自Helsinki NLP Opus...
    packageimg
  • 大型语言模型训练合成数据-Synthia-v1-3数据集

    2025年4月17日   

    大型语言模型训练合成数据-Synthia-v1-3数据集 数据来源:互联网公开数据 标签:大型语言模型,合成数据,训练数据,自然语言处理,文本生成,机器翻译,问答系统,对话生成 数据概述: 本数据集是专为大型语言模型(LLM)开发和改进而设计的合成训练数据集,主要用于研究和优化migel...
    packageimg
  • 英语-伊博语圣经数据集

    2025年4月17日   

    英语-伊博语圣经数据集 数据来源:互联网公开数据 标签:机器翻译,伊博语,圣经文本,英语,语言数据,语料库,宗教文本 数据概述: 本数据集为英语和伊博语的圣经文本对齐数据,主要用于英语至伊博语的机器翻译研究。数据来源于Jehovah...
    packageimg