-
Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki
Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki 数据来源:互联网公开数据 标签:科学考试,数据集,大型语言模型,机器学习,自然语言处理,教育技术,人工智能,评估研究 数据概述:... -
亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998
亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:... -
推特样本数据集TwitterSampleDataset-siddheshshelke
推特样本数据集TwitterSampleDataset-siddheshshelke 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,信息传播 数据概述: 该数据集包含来自推特平台的公开用户数据,记录了用户发布的推文内容及相关信息。主要特征如下:... -
烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265
烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,电影行业,观众反馈 数据概述: 该数据集包含来自烂番茄网站的电影评论数据,主要记录了观众对电影的评价和观点。主要特征如下:... -
深度学习文本情感分析数据集DBERTSentimentAnalysisDataset-thnhanvng
深度学习文本情感分析数据集DBERTSentimentAnalysisDataset-thnhanvng 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,深度学习,文本分类,人工智能,文本挖掘 数据概述: 该数据集包含大量文本数据,用于训练和测试文本情感分析模型,记录了文本的情感极性。主要特征如下:... -
乌尔都语命名实体识别数据集UrduNERDataset-themohal
乌尔都语命名实体识别数据集UrduNERDataset-themohal 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语言技术,乌尔都语,实体识别 数据概述: 该数据集包含乌尔都语文本中的命名实体识别数据,记录了乌尔都语文本中的人名,地名,组织名等实体信息。主要特征如下:... -
多语言文本数据集Multi-LanguageTextDataset-farouqalzeer
多语言文本数据集Multi-LanguageTextDataset-farouqalzeer 数据来源:互联网公开数据 标签:多语言,文本数据,自然语言处理,数据集,机器学习,文本分类,语言翻译,语言技术 数据概述: 该数据集包含来自多个不同语言的文本数据,记录了多种语言的自然语言文本内容。主要特征如下: 时间跨度:... -
Gojek乘客满意度分析数据集GojekSentimentAnalysisDataset-ahmadamanuladib
Gojek乘客满意度分析数据集GojekSentimentAnalysisDataset-ahmadamanuladib 数据来源:互联网公开数据 标签:Gojek, 乘客满意度, 评论分析, 数据集, 自然语言处理, 机器学习, 交通出行, 用户反馈... -
克莱德制作数据集2Claude-madeDatasets2-patricknormile
克莱德制作数据集2Claude-madeDatasets2-patricknormile 数据来源:互联网公开数据 标签:数据集,机器学习,自然语言处理,人工智能,文本分析,数据挖掘,深度学习,模型训练 数据概述: 该数据集由克莱德团队制作,包含了丰富的文本数据资源,适用于自然语言处理,机器学习和人工智能领域的应用。主要特征如下:... -
科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan
科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan 数据来源:互联网公开数据 标签:语言模型,科学考试,数据集,机器学习,自然语言处理,教育,考试评估,知识图谱 数据概述:该数据集包含来自Kaggle的科学考试数据,记录了包含上下文信息的科学考试题及其答案。主要特征如下:... -
印度Reddit社区讨论数据r-IndiaSubredditData-charaiveti
印度Reddit社区讨论数据r-IndiaSubredditData-charaiveti 数据来源:互联网公开数据 标签:社交媒体,Reddit,印度,社区分析,文本挖掘,自然语言处理,情感分析,舆情分析 数据概述:... -
板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa
板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa 数据来源:互联网公开数据 标签:板球,体育,数据集,文本分析,机器学习,自然语言处理,体育新闻,赛事报道 数据概述: 该数据集包含来自Cricinfo网站的比赛文本数据,记录了板球比赛的相关信息。主要特征如下:... -
绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya
绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya 数据来源:互联网公开数据 标签:情景喜剧,电视剧,数据集,文本分析,角色互动,剧本分析,自然语言处理,文化研究 数据概述: 该数据集包含了电视剧《绝命毒师》的情景喜剧相关数据,记录了剧集中对话,场景和角色互动等信息。主要特征如下: 时间跨度:... -
多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan
多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan 数据来源:互联网公开数据 标签:多语言,文本分析,情绪识别,情感计算,自然语言处理,机器学习,心理学,数据集 数据概述:该数据集包含来自多个来源的多语言文本数据,记录了不同语言文本中的情绪标注。主要特征如下:... -
代码数据集CodeDataDataset-hozaifazaki99
代码数据集CodeDataDataset-hozaifazaki99 数据来源:互联网公开数据 标签:代码,数据集,编程,软件开发,机器学习,自然语言处理,代码分析,软件工程 数据概述:该数据集包含来自互联网公开资源的代码数据,记录了不同编程语言的代码片段和项目。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530
谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:... -
多模态文本摘要数据集MT-SummDataset-gsaichaitanya
多模态文本摘要数据集MT-SummDataset-gsaichaitanya 数据来源:互联网公开数据 标签:多模态数据,文本摘要,数据集,自然语言处理,深度学习,机器学习,多媒体分析,信息检索 数据概述: 该数据集包含来自多个来源的多模态文本摘要数据,记录了图像和相应文本的摘要信息。主要特征如下:... -
样本训练数据集-ahmedmohammed244
样本训练数据集-ahmedmohammed244 数据来源:互联网公开数据 标签:机器学习,训练数据,数据集,模型构建,数据预处理,数据分析,人工智能,自然语言处理 数据概述: 该数据集包含用于机器学习模型训练的样本数据,记录了多种类型的样本信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于样本的产生时间。... -
常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd
常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd 数据来源:互联网公开数据 标签:教育研究,文本预处理,数据集,自然语言处理,机器学习,教育技术,文本分析,学术资源 数据概述: 该数据集包含来自CommonLit教育平台的数据,记录了常见教育文本的预处理信息。主要特征如下:... -
推特推文情感分析数据集Dril-GPT2TweetsDataset-jehant
推特推文情感分析数据集Dril-GPT2TweetsDataset-jehant 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,自然语言处理,情感计算,数据科学 数据概述: 该数据集包含来自推特(Twitter)平台的大量推文数据,主要记录了用户发布的文本内容及其情感倾向。主要特征如下:...