-
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261
谷歌翻译SQuAD2-0数据集至印地语和泰米尔语GoogleTranslatedSQuAD2-0toHindiandTamilDataset-tkm2261 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,问答系统,数据集,印地语,泰米尔语,深度学习,文本分析 数据概述: 该数据集包含从SQuAD... -
自然语言处理作业三测试数据集-hangman1998
自然语言处理作业三测试数据集-hangman1998 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分类,情感分析,机器翻译,文本生成,深度学习,NLP 数据概述:该数据集包含了多个用于自然语言处理任务的测试数据,旨在评估和验证NLP模型的效果。主要特征如下: 时间跨度:数据收集时间不限,涵盖不同年份的文本数据。... -
英-马尔地语双语翻译数据集-mayakaripel
英-马尔地语双语翻译数据集-mayakaripel 数据来源:互联网公开数据 标签:英-马尔地语,双语翻译,机器翻译,NLP,语言学习,数据集,信息检索,情感分析,知识转移 数据概述: 本数据集包含成对的英-马尔地语翻译句子,为机器翻译和其他跨语言自然语言处理(NLP)任务提供了宝贵的资源。数据集中的每一对句子都是彼此的翻译,适用于开发和评估英-... -
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03
英法翻译数据集English-FrenchTranslationDataset-endofnight17j03 数据来源:互联网公开数据 标签:机器翻译,翻译,自然语言处理,数据集,语言模型,文本数据,双语语料库,NLP 数据概述: 该数据集包含英法双语翻译文本,记录了英语句子及其对应的法语翻译。主要特征如下:... -
双语文本对齐数据集BitextDataCollection-imaadhasan
双语文本对齐数据集BitextDataCollection-imaadhasan 数据来源:互联网公开数据 标签:自然语言处理,机器翻译,数据集,文本对齐,双语数据,语言技术,数据挖掘,人工智能 数据概述: 该数据集包含来自多个来源的双语文本对齐数据,记录了不同语言之间的文本对应关系。主要特征如下:... -
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige
BERT模型基线实验数据集BERTBaselineExperimentDataset-kenkrige 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器翻译,文本生成,深度学习,BERT模型 数据概述: 该数据集包含了用于训练和评估BERT模型的基础文本数据,用于构建BERT模型的基线实验。主要特征如下:... -
WebGPT与OpenAI模型性能对比数据集
WebGPT与OpenAI模型性能对比数据集 数据来源:互联网公开数据 标签:WebGPT, OpenAI, 模型对比, 自然语言处理, 文本生成, 性能评估, 机器翻译, 问答系统 数据概述:... -
Mistral-8k困惑度评估数据集-hozaifazaki
Mistral-8k困惑度评估数据集-hozaifazaki 数据来源:互联网公开数据 标签:自然语言处理,大语言模型,困惑度,评估,数据集,文本分析,机器翻译,生成模型 数据概述:该数据集包含用于评估Mistral-8k大语言模型困惑度的文本数据,旨在衡量模型对不同文本序列的理解和预测能力。主要特征如下: 时间跨度:数据记录时间范围不限,持续更新。... -
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro
英语-法语机器翻译数据集English-FrenchMachineTranslationDataset-marwanmohamedmaro 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,双语数据,英语,法语,文本分析,人工智能 数据概述: 该数据集包含来自公开来源的英语-... -
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe
英语句子到尼泊尔语句子翻译数据集EnglishSentencetoNepaliSentencesTranslationDataset-jyotsanexe 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,语言学习,数据集,英语,尼泊尔语,文本翻译,语言技术... -
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch
德国联邦议院议员演讲文本翻译与摘要数据集-2021-2022-kevinbnisch 数据来源:互联网公开数据 标签:德国联邦议院,演讲,文本分析,翻译,摘要,政治,NLP,自然语言处理,机器翻译,BART模型 数据概述: 本数据集包含1万篇德国联邦议院议员的演讲文本,这些演讲文本均来源于德国联邦议院官方网站。数据经过网络抓取,并使用OPUS-... -
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian
波斯语翻译英语验证数据集ParsinluTranslationEN-FAValidationDataset-nouriehmadanian 数据来源:互联网公开数据 标签:机器翻译,波斯语,英语,数据集,自然语言处理,文本翻译,语言学,验证 数据概述: 该数据集包含来自Parsinlu项目,用于验证波斯语到英语翻译模型的性能。主要特征如下:... -
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien
酒店评论翻译数据集TranslatedHotelsReviewDataset-franoisgeorgesjulien 数据来源:互联网公开数据 标签:酒店评论,数据集,自然语言处理,机器翻译,文本分析,旅游行业,用户体验,情感分析 数据概述: 该数据集包含来自全球多家酒店的评论数据,记录了用户对酒店的评价和反馈,并提供了多语言翻译版本。主要特征如下:... -
伊朗阿尔帕卡数据集-英文到波斯文翻译-amirpourmand
伊朗阿尔帕卡数据集-英文到波斯文翻译-amirpourmand 数据来源:互联网公开数据 标签:阿尔帕卡数据集,翻译,英文,波斯文,Meta NLLB,机器翻译,NLP,数据集,翻译工具 数据概述: 本数据集由Meta... -
汉字华语处理句对数据集-yuweiiizz
汉字华语处理句对数据集-yuweiiizz 数据来源:互联网公开数据 标签:汉字,华语,自然语言处理,机器翻译,语义分析,方言学,语料库,文本挖掘 数据概述: 本数据集包含传统中文与现代中文或台式中文之间的配对句子,旨在促进自然语言处理任务,特别是机器翻译和语义分析。每个数据对由一条传统中文句子及其等效的现代中文或台式中文句子组成。 数据用途概述:... -
科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea
科学论文摘要摘要数据集SciTLDR-A-adityawithdoublea 数据来源:互联网公开数据 标签:论文摘要, 文本摘要, 自然语言处理, 科学论文, 摘要生成, 机器翻译, 文本分析 数据概述: SciTLDR-... -
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:... -
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:... -
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420
泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:...