-
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak
预训练BERT大型语言模型数据集PreprosBERTLargeDataset-fattahpradiptak 数据来源:互联网公开数据 标签:自然语言处理,BERT模型,数据集,机器学习,文本分析,深度学习,语言学,人工智能 数据概述: 该数据集为BERT大型语言模型的预训练数据,主要包含用于训练BERT模型的文本数据。主要特征如下:... -
词义消歧数据集WSDData-abdelrahmanelbakouri
词义消歧数据集WSDData-abdelrahmanelbakouri 数据来源:互联网公开数据 标签:自然语言处理,词义消歧,数据集,语义分析,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含了用于词义消歧(Word Sense Disambiguation,... -
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom
孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:... -
卡纳达语情感分析数据集-kishorsinnur
卡纳达语情感分析数据集-kishorsinnur 数据来源:互联网公开数据 标签:情感分析,卡纳达语,自然语言处理,数据集,文本分类,机器学习,印度语言,语言学 数据概述:该数据集包含来自各种来源的卡纳达语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了从近期到过去一段时间的文本数据。... -
泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius
泰米尔语新闻标题翻译数据集TamilNewsHeadlinesTranslationDataset-abishpius 数据来源:互联网公开数据 标签:泰米尔语,新闻标题,翻译,数据集,自然语言处理,机器翻译,语言学,媒体分析 数据概述:该数据集包含来自多个来源的泰米尔语新闻标题及其英文翻译,适用于自然语言处理和机器翻译等任务。主要特征如下:... -
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369
自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:... -
英语古兰经EnglishQuranDataset-esraaaabdelrazek
英语古兰经EnglishQuranDataset-esraaaabdelrazek 数据来源:互联网公开数据 标签:古兰经,数据集,宗教,伊斯兰教,翻译,文本分析,语言学,学术研究 数据概述: 该数据集包含英语翻译的《古兰经》,记录了古兰经的文本内容及其相关注释。主要特征如下: 时间跨度:数据记录的时间范围从现代翻译版本开始。... -
阿拉伯语情感对话数据集-ibrahimgahmed
阿拉伯语情感对话数据集-ibrahimgahmed 数据来源:互联网公开数据 标签:阿拉伯语,情感分析,对话,自然语言处理,机器学习,文本数据,语言学,情绪识别 数据概述:该数据集包含阿拉伯语的对话数据,记录了对话参与者之间的情感表达。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了多种日常对话场景。... -
印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk
印度英语阅读理解训练数据集ChaiiTrainCleanDataset-trushk 数据来源:互联网公开数据 标签:阅读理解,自然语言处理,数据集,文本分析,机器学习,英语,印度,语言学 数据概述: 该数据集包含来自 Chaii 竞赛的清理过的印度英语阅读理解训练数据,旨在帮助研究人员和开发人员训练和评估阅读理解模型。主要特征如下:... -
UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong
UIT-VSFC诗歌翻译数据集UIT-VSFCPoemTranslationDataset-haiimphuong 数据来源:互联网公开数据 标签:诗歌翻译,数据集,自然语言处理,机器翻译,文本分析,越南语,英语,语言学 数据概述: 该数据集包含来自UIT-VSFC项目提供的诗歌翻译数据,记录了越南语诗歌及其对应的英语翻译。主要特征如下:... -
多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction
多语言常用词汇数据集CommonWordsof100LanguagesDataset-coddiction 数据来源:互联网公开数据 标签:语言学,多语言,词汇数据集,自然语言处理,翻译研究,语言对比,数据科学,教育技术 数据概述: 该数据集包含来自100种不同语言的常用词汇数据,记录了各语言中的基础词汇及其对应翻译。主要特征如下:... -
中文互联网帖子处理数据集PostprocessedVernacularDataset-parthplc
中文互联网帖子处理数据集PostprocessedVernacularDataset-parthplc 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,中文,社交媒体,情感分析,文本挖掘,语言学 数据概述: 该数据集包含从中文互联网收集的帖子文本数据,经过了后处理和清洗。主要特征如下:... -
日本社交平台对话数据集JapanConversationDataset-nguyencongcuong
日本社交平台对话数据集JapanConversationDataset-nguyencongcuong 数据来源:互联网公开数据 标签:对话数据,日语,文本分析,自然语言处理,情感分析,社交媒体,语言学,机器学习 数据概述: 该数据集包含来自日本社交平台的用户对话数据,记录了用户间的交流内容。主要特征如下: 时间跨度:数据记录的时间范围为未知。... -
德语语法数据集GermanGrammarDataset-upamasarker
德语语法数据集GermanGrammarDataset-upamasarker 数据来源:互联网公开数据 标签:语言学,语法分析,数据集,自然语言处理,教育技术,机器学习,德语学习,语言研究 数据概述: 该数据集包含来自德语语法研究项目的数据,记录了德语语法规则和例句的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。... -
文件词汇统计数据集WordsFileDataset-jordansiem
文件词汇统计数据集WordsFileDataset-jordansiem 数据来源:互联网公开数据 标签:文本分析,词汇统计,数据集,自然语言处理,数据挖掘,语言学,机器学习,教育研究 数据概述: 该数据集包含来自多个文本文件的数据,记录了不同文件中的词汇信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。... -
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100
大规模多语种文本训练数据集ALL-MASCTrainDatasets-saeed1507100 数据来源:互联网公开数据 标签:文本数据,多语种,自然语言处理,机器学习,语料库,文本分析,语言学,训练数据 数据概述: 该数据集包含大规模多语种文本训练数据,主要用于自然语言处理(NLP)模型的训练和评估。主要特征如下:... -
印度语文本情感分析数据集-siddhantkhobragade
印度语文本情感分析数据集-siddhantkhobragade 数据来源:互联网公开数据 标签:情感分析,印度语,文本数据,自然语言处理,机器学习,文本挖掘,社会科学,语言学 数据概述: 该数据集包含来自各种来源的印度语文本数据,主要用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了近期社交媒体和其他在线平台上的文本。... -
欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb
欧洲议会命名实体识别数据集EuroParlNamedEntityRecognitionDataset-julianschelb 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器翻译,语言学,NLP,欧洲议会 数据概述: 该数据集包含来自欧洲议会会议记录的文本数据,专注于命名实体识别任务。主要特征如下:... -
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled
阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:... -
阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov
阿塞拜疆语情感分析数据集SentimentDatasetforAzerbaijaniLanguage-natigmamishov 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,阿塞拜疆语,文本挖掘,机器学习,社交媒体分析,语言学 数据概述:...