-
翻译数据数据集TranslatedDataDataset-krsna540
翻译数据数据集TranslatedDataDataset-krsna540 数据来源:互联网公开数据 标签:翻译,数据集,语言处理,机器学习,自然语言处理,多语言,文本分析,数据转换 数据概述: 该数据集包含来自互联网的翻译数据,记录了不同语言之间的文本翻译结果。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。... -
中文文本翻译数据集TranslatedTextDataset-amithsurasani
中文文本翻译数据集TranslatedTextDataset-amithsurasani 数据来源:互联网公开数据 标签:文本翻译,数据集,自然语言处理,机器学习,语言学,人工智能,多语言,文本分析 数据概述: 该数据集包含来自互联网公开来源的中文文本翻译数据,记录了多种语言与中文之间的翻译对。主要特征如下:... -
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike
多标签英语和孟加拉语评论数据集Multi-labeledEnglishandBanglaCommentsDataset-sanzidasiddike 数据来源:互联网公开数据 标签:自然语言处理,多语言,数据集,情感分析,机器学习,文本分类,情感识别,语言处理 数据概述:... -
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd
西班牙语歌曲歌词数据集SpanishSongsLyricsDataset-pinooxd 数据来源:互联网公开数据 标签:音乐,歌词,数据集,语言分析,自然语言处理,文化研究,机器学习,多语言 数据概述: 该数据集包含来自互联网公开渠道的西班牙语歌曲歌词数据,记录了多种西班牙语歌曲的歌词文本。主要特征如下:... -
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar
欧洲议会代词数据集ItalianLanguagePronounDataset-harshitdhankhar 数据来源:互联网公开数据 标签:语言处理,数据集,自然语言,机器学习,文本分析,意大利语,代词研究,多语言 数据概述: 该数据集来源于欧洲议会会议记录,专注于意大利语中的代词使用情况。主要特征如下:... -
情绪符号情感分析数据集-2015-thomasseleck
情绪符号情感分析数据集-2015-thomasseleck 数据来源:互联网公开数据 标签:情绪符号,情感分析,社交媒体,机器学习,自然语言处理,多语言,人类标注,科研 数据概述: 本数据集包含751个情绪符号及其自动分配的情感评分。情感评分是基于来自70,000条推文的分析得出的,这些推文由83位人类标注者在13种欧洲语言中进行标注。... -
智利圣地牙哥Airbnb住宿评论数据集-2010至2023年-crisbebop
智利圣地牙哥Airbnb住宿评论数据集-2010至2023年-crisbebop 数据来源:互联网公开数据 标签:Airbnb,住宿评论,圣地牙哥,智利,旅游,用户评价,多语言 数据概述:... -
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas
英语到孟加拉语翻译数据集EnglishtoBengaliTranslationDataset-ritankardas 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,机器学习,语言模型,文本分析,多语言,人工智能 数据概述: 该数据集包含英语到孟加拉语的平行语料,记录了双语翻译的对应句子。主要特征如下:... -
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030
语言识别数据集HalfdatasetLanguageIdentificationDataset-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,数据挖掘,人工智能 数据概述: 该数据集包含来自多个语言样本的文本数据,记录了不同语言的文本片段及其对应的语言标签。主要特征如下:... -
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2
印地语与英语混合语言数据集Hindi-EnglishCodemixBalancedDataset-pinakisahu2 数据来源:互联网公开数据 标签:语言混合,数据集,自然语言处理,多语言,机器学习,文本分析,语言研究,翻译技术 数据概述: 该数据集包含来自印地语与英语混合语言环境的数据,记录了两种语言在文本中的混合使用情况。主要特征如下:... -
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版
Jigsaw多语言有毒评论分类数据集-评论翻译与情感分析增强版 数据来源:互联网公开数据 标签:文本分类,自然语言处理,情感分析,多语言,有毒评论,评论数据,机器翻译,英语,机器学习 数据概述:... -
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar
英语到印地语翻译数据集English-to-HindiTranslationDataset-vimlkumar 数据来源:互联网公开数据 标签:机器翻译,语言处理,数据集,印地语,英语,自然语言处理,翻译研究,多语言 数据概述: 该数据集包含英语到印地语的翻译对,记录了4000个英语句子及其对应的印地语翻译。主要特征如下:... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:... -
欧洲足球俱乐部推特内容数据集-2021-2022-eliasdabbas
欧洲足球俱乐部推特内容数据集-2021-2022-eliasdabbas 数据来源:互联网公开数据 标签:足球,推特,社交媒体,俱乐部,欧洲,数据分析,多语言,粉丝互动 数据概述:... -
多语言自然语言推理与跨语言推理数据集
多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-... -
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing
葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:... -
多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9
多语言自然语言推理数据集MultilingualNLPInferenceDataset-sanjusrivatsa9 数据来源:互联网公开数据 标签:自然语言处理,多语言,推理,数据集,机器学习,深度学习,人工智能,文本分析 数据概述: 该数据集包含来自多个来源的多语言文本数据,专门用于自然语言推理任务。主要特征如下: 时间跨度:... -
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073
多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073 数据来源:互联网公开数据 标签:仇恨言论,多语言,自然语言处理,文本分类,机器学习,情感分析,社交媒体,数据集 数据概述: 该数据集包含来自社交媒体平台的多语言文本数据,旨在用于仇恨言论的检测和分类。主要特征如下:... -
语言翻译数据集LanguageTranslationDataset-rohitwaldekar
语言翻译数据集LanguageTranslationDataset-rohitwaldekar 数据来源:互联网公开数据 标签:语言翻译,数据集,机器学习,自然语言处理,文本分析,多语言,人工智能,数据挖掘 数据概述: 该数据集包含来自多个语言翻译项目的数据,记录了不同语言之间的文本翻译对。主要特征如下:... -
尼日利亚多语言仇恨言论数据集2024-sharonibejih
尼日利亚多语言仇恨言论数据集2024-sharonibejih 数据来源:互联网公开数据 标签:仇恨言论,尼日利亚,多语言,机器翻译,社交媒体,数据分析 数据概述:...