-
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentReasoningDataset-mariasolano
多语言文本蕴含关系推理数据集MultilingualTextualEntailmentReasoningDataset-mariasolano 数据来源:互联网公开数据 标签:文本蕴含, 自然语言推理, 多语言, 语言识别, 文本匹配, 机器阅读理解, 语义分析, 情感分析 数据概述:... -
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee
多语言自然语言推理矛盾检测数据集MultilingualNaturalLanguageInferenceContradictionDetection-vijayee 数据来源:互联网公开数据 标签:自然语言推理, 文本蕴含, 矛盾检测, 多语言, 文本分类, 机器翻译, 语言学, 阿拉伯语 数据概述:... -
仇恨言论检测数据集HateSpeechDetectionDataset-suramyajadhav
仇恨言论检测数据集HateSpeechDetectionDataset-suramyajadhav 数据来源:互联网公开数据 标签:仇恨言论, 文本分类, 情感分析, 社交媒体, 多语言, 自然语言处理, 机器学习, 恶意内容检测 数据概述:... -
多语言疾病治疗问答数据集MultilingualDiseaseTreatmentQuestion-AnswerDataset-allinone123456
多语言疾病治疗问答数据集MultilingualDiseaseTreatmentQuestion-AnswerDataset-allinone123456 数据来源:互联网公开数据 标签:医疗健康, 多语言, 问答系统, 疾病治疗, 自然语言处理, 文本翻译, 语义理解, 数据标注 数据概述:... -
全球语言翻译数据集WorldLanguageTranslationsDataset-cynthiawestcynths
全球语言翻译数据集WorldLanguageTranslationsDataset-cynthiawestcynths 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,多语言,机器学习,文本处理,人工智能,跨文化研究 数据概述: 该数据集包含来自全球多语言翻译项目的数据,记录了多种语言之间的文本翻译内容。主要特征如下:... -
语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing
语言学习与自然语言处理数据集LangsData-LanguageLearningandNLPDataset-rookiejing 数据来源:互联网公开数据 标签:语言学习,自然语言处理,数据集,机器学习,翻译技术,文本分析,教育科技,多语言 数据概述:... -
阿姆哈拉语文本数据集AmharicDataDataset-azzaal
阿姆哈拉语文本数据集AmharicDataDataset-azzaal 数据来源:互联网公开数据 标签:阿姆哈拉语,文本数据,数据集,语言处理,自然语言处理,机器学习,多语言,非洲语言 数据概述: 该数据集包含来自公开来源的阿姆哈拉语文本数据,记录了阿姆哈拉语的文本内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,可能涵盖多个时间段。... -
印地语验证标记数据集HindiValidationTokensDataset-pranav51286
印地语验证标记数据集HindiValidationTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,印地语,标记化,数据集,语言模型,机器学习,文本处理,多语言 数据概述: 该数据集包含来自印地语语料库的验证标记数据,主要用于语言模型训练和评估。主要特征如下:... -
跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11
跨语言希望语音检测数据集HopeSpeechDetectionAcrossMultipleLanguagesDataset-nomanjaffar11 数据来源:互联网公开数据 标签:语音识别,情感分析,多语言,数据集,自然语言处理,机器学习,仇恨言论检测,语音数据 数据概述:... -
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc
仅英文MT5翻译数据集OnlyEnglishMT5TranslationDataset-parthplc 数据来源:互联网公开数据 标签:机器翻译,数据集,文本翻译,自然语言处理,英语,多语言,深度学习,NLP 数据概述: 该数据集包含了用于训练和评估多语言翻译模型(MT5)的英语翻译数据,专注于英语与其他语言之间的翻译。主要特征如下:... -
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,情感分析,数据挖掘,多语言,文本标注 数据概述:... -
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen
英语到阿坎特语单词翻译数据集English-to-Akan-Twi-WordsDataset-derrickzhen 数据来源:互联网公开数据 标签:语言翻译,数据集,自然语言处理,多语言,机器学习,文本分析,语言学习,翻译技术 数据概述: 该数据集包含来自英语到阿坎特语(Twi)的单词翻译记录,记录了两个语言之间的词汇对应关系。主要特征如下:... -
多语言问答数据集-TyDiQA可回答问题子集
多语言问答数据集-TyDiQA可回答问题子集 数据来源:互联网公开数据 标签:自然语言处理,NLP,问答系统,机器阅读理解,多语言,文本数据,AI,语言学,TydiQA,Hugging Face 数据概述: Answerable-TyDiQA数据集是TyDi QA数据集的子集,TyDi QA是一个涵盖11种语言的问答数据集。Answerable-... -
语言分类数据集LanguageClassificationDataset-jhaamanvaibhav
语言分类数据集LanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,自然语言处理,数据集,机器学习,文本分析,多语言,数据挖掘,文本分类 数据概述: 该数据集包含来自多个来源的语言分类数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:... -
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar
日语平假名与越南语数据集Hiragana-Japanese-VietnameseDataset-flightstar 数据来源:互联网公开数据 标签:语言学习,数据集,平假名,越南语,字符识别,自然语言处理,机器学习,多语言 数据概述: 该数据集包含日语平假名与越南语的相关数据,记录了两种语言之间的对应关系和语言特征。主要特征如下:... -
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach
社交媒体图片描述与尼泊尔语翻译数据集Flickr-8kNepaliTranslationsDataset-mdteach 数据来源:互联网公开数据 标签:图像描述,翻译,社交媒体,数据集,自然语言处理,机器翻译,多语言,计算机视觉 数据概述:该数据集包含来自Flickr平台的图片及其描述,并提供了相应描述的尼泊尔语翻译。主要特征如下:... -
维基多语言文本分类数据集-2018
维基多语言文本分类数据集-2018 数据来源:互联网公开数据 标签:文本分类,多语言,自然语言处理,机器学习,语言识别,维基百科,NLP,数据集 数据概述:... -
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta
多语言机器阅读理解与印地语问答数据集MLQAXQUADHindiDataset-aashitadutta 数据来源:互联网公开数据 标签:机器学习,自然语言处理,阅读理解,多语言,印地语,问答系统,数据集,人工智能 数据概述:... -
Twitter情绪分类数据集英语-印尼语Twitter情绪分类数据集英语-印尼语-uom200088d
Twitter情绪分类数据集英语-印尼语Twitter情绪分类数据集英语-印尼语-uom200088d 数据来源:互联网公开数据 标签:情绪分类,社交媒体,数据集,机器学习,自然语言处理,文本分析,情感分析,多语言 数据概述:该数据集包含来自Twitter的推文,记录了用户的英语和印尼语推文及其对应的情绪标签。主要特征如下:... -
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist
多语言语音识别与翻译数据集FLEURSKADatasetCSV-lokotwist 数据来源:互联网公开数据 标签:语音识别,机器翻译,多语言,数据集,自然语言处理,人工智能,语音技术,语言模型 数据概述: 该数据集来自FLEURS(Facebook LibriSpeech Utterance...