-
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM... -
阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache
阿拉伯语文本可读性与长文本摘要数据集-elhadjemechache 数据来源:互联网公开数据 标签:阿拉伯语,文本可读性,文本摘要,自然语言处理,语言学,数据集,机器翻译,深度学习 数据概述: 该数据集包含阿拉伯语文本,用于研究阿拉伯语文本的可读性和文本摘要。主要特征如下: 时间跨度: 数据记录的时间范围不明确,数据本身为静态文本集合。 地理范围:... -
Evol-Codealpaca中英指令转换数据集
Evol-Codealpaca中英指令转换数据集 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,中英翻译,指令转换,代码生成,语言模型,数据集,Hugging Face 数据概述: 本数据集由Evol-... -
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29
汉字与拉丁文翻译数据集Hi-TranslitDataset-jaydee29 数据来源:互联网公开数据 标签:汉字转写,拉丁文翻译,数据集,自然语言处理,文本转换,机器翻译,语言学,字符编码 数据概述: 该数据集包含汉字与拉丁文之间的翻译数据,适用于研究汉字转写为拉丁文的技术。主要特征如下: 时间跨度:数据记录的时间范围从2020年到2023年。... -
孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087
孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087 数据来源:互联网公开数据 标签:数学问题,数据集,孟加拉语,COT,问题解答,自然语言处理,机器翻译,教育 数据概述: 该数据集包含孟加拉语数学问题的文本数据,旨在用于问题解答和自然语言处理任务。主要特征如下:... -
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr
阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:... -
Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui
Flick30斯瓦希里语图像数据集Flick30SwahiliImageDataset-sharontonui 数据来源:互联网公开数据 标签:图像,斯瓦希里语,多模态,自然语言处理,图像描述,数据集,机器翻译,计算机视觉 数据概述:... -
英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator
英语和摩洛哥塔马兹格特与塔加拜勒特翻译数据集-thedevastator 数据来源:互联网公开数据 标签:翻译,英语,摩洛哥塔马兹格特,塔加拜勒特,数据集,机器翻译,语言学,教育 数据概述: 本数据集来源于Mozilla的Pontoon本地化平台,名为imone/ARB指令-... -
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar
英语到西班牙语翻译数据集English-to-Spanish-2Dataset-franksalazar 数据来源:互联网公开数据 标签:机器翻译,英语,西班牙语,数据集,自然语言处理,文本翻译,双语资源,语言技术 数据概述: 该数据集包含英语到西班牙语的平行文本数据,主要记录了双语句子对,适用于机器翻译和自然语言处理任务。主要特征如下:... -
英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69
英语到泰卢固语句子翻译数据集EnglishtoTeluguSentencesTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,语言数据,数据集,泰卢固语,英语,自然语言处理,翻译研究,多语言处理 数据概述: 该数据集包含英语到泰卢固语的句子翻译对,记录了大量的双语句子对照数据。主要特征如下:... -
印地文-英文双语数据集Hinglish-EnglishDataset-arpcode
印地文-英文双语数据集Hinglish-EnglishDataset-arpcode 数据来源:互联网公开数据 标签:双语数据集,语言学,自然语言处理,机器翻译,文本分析,数据集,印度语言,国际交流 数据概述:该数据集包含来自多个来源的印地文-英文双语数据,主要用于研究和开发印地文与英文之间的翻译和文本分析。主要特征如下:... -
预训练RoBERTa-base模型预测结果数据集-mathislucka
预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:... -
自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb
自然语言处理NLP神经机器翻译数据集NN-NLPNeuralMachineTranslationDataset-tarekelkhateb 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,深度学习,神经网络,文本处理,语言模型,翻译模型 数据概述:... -
阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889
阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:... -
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah
美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah 数据来源:互联网公开数据 标签:专利数据,数据扩充,机器翻译,自然语言处理,数据集,文本分析,创新研究,知识产权... -
英印机器翻译练习数据集-arunmohan003
英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:... -
CommonLit英语文章摘要数据集-artisusxiren
CommonLit英语文章摘要数据集-artisusxiren 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,英语学习,机器翻译,文本分析,语言模型,教育 数据概述: 该数据集包含来自CommonLit平台提供的英语文章摘要数据,旨在用于文本摘要,自然语言处理和英语学习相关的研究。主要特征如下:... -
阿拉伯语手语与阿拉伯英文句子对应数据集-mohamedlotfy50
阿拉伯语手语与阿拉伯英文句子对应数据集-mohamedlotfy50 数据来源:互联网公开数据 标签:阿拉伯语手语,机器翻译,自动翻译,教育,语言学,翻译,手语数据,阿拉伯语,英语 数据概述:... -
印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey
印度语电影字幕数据集HindiLanguageMovieSubtitlesDataset-mogazeyalmogazey 数据来源:互联网公开数据 标签:印度语,电影,字幕,自然语言处理,文本分析,语言学,机器翻译,数据集 数据概述: 该数据集包含了印度语电影的字幕数据,记录了大量印度语电影的字幕文本。主要特征如下:... -
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath
孟加拉语段落数据集BanglaParagraphDataset-nilarnabdebnath 数据来源:互联网公开数据 标签:自然语言处理,孟加拉语,文本分析,机器学习,语言模型,数据集,文本分类,机器翻译 数据概述: 该数据集包含来自孟加拉语的段落文本数据,记录了孟加拉语的段落内容。主要特征如下: 时间跨度:数据记录的时间范围不明确。...