-
尼日利亚多语言仇恨言论数据集2024-sharonibejih
尼日利亚多语言仇恨言论数据集2024-sharonibejih 数据来源:互联网公开数据 标签:仇恨言论,尼日利亚,多语言,机器翻译,社交媒体,数据分析 数据概述:... -
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh
英语到西班牙语翻译数据集English-to-SpanishTranslationDataset-hareeeshhh 数据来源:互联网公开数据 标签:机器翻译,数据集,自然语言处理,翻译模型,语言学,深度学习,文本数据,英语西班牙语 数据概述: 该数据集包含英语到西班牙语的翻译对,记录了英语文本及其对应的西班牙语翻译。主要特征如下:... -
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48
英语到法语机器翻译数据集WMTSampled50000English-FrenchTranslationDataset-hoyso48 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,英语,法语,数据挖掘,人工智能,多语言处理 数据概述: 该数据集来自WMT(Workshop on Machine... -
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar
越南语与德语平行语料数据集Vietnamese-GermanParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,语料库,双语数据,文本分析,人工智能,语言技术 数据概述: 该数据集包含越南语与德语的平行语料数据,记录了两种语言之间的对齐文本。主要特征如下:... -
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15
土耳其电影评论情感分析数据集-贝亚兹帕尔德网站-ozcan15 数据来源:互联网公开数据 标签:情感分析,NLP,土耳其语,电影评论,用户反馈,数据集,交叉语言分析,机器翻译,数据科学 数据概述:... -
英语-孟加拉语多元化翻译数据集-2023年-golammostofas
英语-孟加拉语多元化翻译数据集-2023年-golammostofas 数据来源:互联网公开数据 标签:英语,孟加拉语,翻译,自然语言处理,NLP,对话生成,文化分析,机器翻译,多语言研究 数据概述:... -
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151
英语到马拉地语翻译数据集-基于谷歌翻译及NLP数据集-tanmaypatil3151 数据来源:互联网公开数据 标签:机器翻译,NLP,自然语言处理,翻译,英语,马拉地语,seq2seq,神经机器翻译,数据集 数据概述:... -
英语-马拉雅拉姆语言翻译数据集-nihalthomas15
英语-马拉雅拉姆语言翻译数据集-nihalthomas15 数据来源:互联网公开数据 标签:英语,马拉雅拉姆,机器翻译,NLP,语料库,翻译,数据集,多语言 数据概述:... -
跨语言问答数据集XQuAD印地语部分2019-nbroad
跨语言问答数据集XQuAD印地语部分2019-nbroad 数据来源:互联网公开数据 标签:跨语言问答,自然语言处理,机器翻译,多语言数据集,印地语,文本理解 数据概述: 本数据集是XQuAD(跨语言问答数据集)中的印地语部分,用于评估跨语言问答性能。数据集包含SQuAD v1.1开发集的子集,共有240段落和1190个问题-... -
跨语言问答数据集XQuAD多语言问答数据集-thedevastator
跨语言问答数据集XQuAD多语言问答数据集-thedevastator 数据来源:互联网公开数据 标签:问答, 跨语言, 自然语言处理, 机器翻译, 文本理解, SQuAD, 语言模型, 英语, 西班牙语, 德语, 希腊语, 俄语, 土耳其语, 阿拉伯语, 越南语, 泰语, 汉语, 印地语 数据概述:... -
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak
林格万克斯多语言机器翻译测试参考数据集-2023-alexeirudak 数据来源:互联网公开数据 标签:机器翻译,测试参考,多语言,语言技术,评估,数据集,英语,翻译评估,CC BY-SA 4.0 数据概述:... -
英法翻译数据集-英语至法语翻译项目-数据-通用
英法翻译数据集-英语至法语翻译项目-数据-通用 数据来源:互联网公开数据 标签:翻译,英语,法语,机器翻译,自然语言处理,Transformer,文本数据,语言学,数据集 数据概述: 本数据集用于基于Transformer架构的英法翻译项目。数据集包含大量的英语-... -
电影字幕多语言平行数据集
电影字幕多语言平行数据集 数据来源:互联网公开数据 标签:电影字幕,多语言平行数据,英语到阿拉伯语,英语到法语,英语到印度尼西亚语,英语到泰语,时间对齐,机器翻译,自然语言处理 数据概述:... -
英语-达里贾双语数据集
英语-达里贾双语数据集 数据来源:互联网公开数据 标签:机器翻译,双语语料库,摩洛哥阿拉伯语,达里贾,自然语言处理,翻译模型,语言学习 数据概述: 本数据集是一个社区驱动的双语语料库,由MAD-... -
英语-泰语平行语料库
英语-泰语平行语料库 数据来源:互联网公开数据 标签:平行语料库,机器翻译,自然语言处理,英语,泰语,跨语言分析,文本对齐,翻译模型训练 数据概述: 本数据集是一个大型的英语-... -
电影评论及其法语翻译数据集
电影评论及其法语翻译数据集 数据来源:互联网公开数据 标签:电影评论,IMDb,法语翻译,文本处理,情感分析,机器翻译,跨语言分析 数据概述: 本数据集基于Aditya、P.等人的IMDb电影评论数据集构建,包含多部电影的评论数据,每条评论对应一部特定电影。数据集经过清洗和规则化处理,以确保数据质量,并使用Google Translate... -
Flickr8k图像日语翻译数据集
Flickr8k图像日语翻译数据集 数据来源:互联网公开数据 标签:图像标注,日语翻译,机器翻译,图像识别,自然语言处理,图像描述,Flickr8k,多模态,文本数据 数据概述:... -
印度语维基百科文章问答对数据集-问答生成-36-6k
印度语维基百科文章问答对数据集-问答生成-36-6k 数据来源:互联网公开数据 标签:问答对,印度语,维基百科,自然语言处理,机器翻译,问答生成,文本数据,语言学习 数据概述:... -
多语言平行语料库数据集
多语言平行语料库数据集 数据来源:互联网公开数据 标签:多语言,平行语料库,翻译,机器翻译,自然语言处理,跨语言数据分析 数据概述: 本数据集是一个多语言平行语料库,包含英语与其他多种语言(如俄语、哈萨克语、西班牙语、意大利语和法语)之间的对照翻译数据。数据集来源于对原始的databricks-... -
英语-印地语句子翻译数据集
英语-印地语句子翻译数据集 数据来源:互联网公开数据 标签:语言翻译,英语,印地语,机器翻译,自然语言处理,双语句对,文本对齐 数据概述: 本数据集来自Helsinki NLP Opus...