找到11,849个数据集

标签: 自然语言处理

过滤结果
  • Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki

    2025年4月24日   

    Kaggle大型语言模型科学考试数据集KaggleLargeLanguageModelScienceExamDataset-sabahesaraki 数据来源:互联网公开数据 标签:科学考试,数据集,大型语言模型,机器学习,自然语言处理,教育技术,人工智能,评估研究 数据概述:...
    packageimg
  • 亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998

    2025年4月24日   

    亚马逊2023年多语言商品评论数据集AmazonML2023LanguageDataset-narendra1998 数据来源:互联网公开数据 标签:电商,商品评论,自然语言处理,多语言,情感分析,机器学习,文本分析,亚马逊 数据概述: 该数据集由亚马逊提供,包含了来自亚马逊平台的商品评论数据,覆盖多种语言。主要特征如下:...
    packageimg
  • 推特样本数据集TwitterSampleDataset-siddheshshelke

    2025年4月24日   

    推特样本数据集TwitterSampleDataset-siddheshshelke 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,信息传播 数据概述: 该数据集包含来自推特平台的公开用户数据,记录了用户发布的推文内容及相关信息。主要特征如下:...
    packageimg
  • 烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265

    2025年4月24日   

    烂番茄电影评论情感分析数据集RottenTomatoesViewsDataset-rohit265 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,电影行业,观众反馈 数据概述: 该数据集包含来自烂番茄网站的电影评论数据,主要记录了观众对电影的评价和观点。主要特征如下:...
    packageimg
  • 深度学习文本情感分析数据集DBERTSentimentAnalysisDataset-thnhanvng

    2025年4月24日   

    深度学习文本情感分析数据集DBERTSentimentAnalysisDataset-thnhanvng 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,深度学习,文本分类,人工智能,文本挖掘 数据概述: 该数据集包含大量文本数据,用于训练和测试文本情感分析模型,记录了文本的情感极性。主要特征如下:...
    packageimg
  • 乌尔都语命名实体识别数据集UrduNERDataset-themohal

    2025年4月24日   

    乌尔都语命名实体识别数据集UrduNERDataset-themohal 数据来源:互联网公开数据 标签:自然语言处理,命名实体识别,数据集,文本分析,机器学习,语言技术,乌尔都语,实体识别 数据概述: 该数据集包含乌尔都语文本中的命名实体识别数据,记录了乌尔都语文本中的人名,地名,组织名等实体信息。主要特征如下:...
    packageimg
  • 多语言文本数据集Multi-LanguageTextDataset-farouqalzeer

    2025年4月24日   

    多语言文本数据集Multi-LanguageTextDataset-farouqalzeer 数据来源:互联网公开数据 标签:多语言,文本数据,自然语言处理,数据集,机器学习,文本分类,语言翻译,语言技术 数据概述: 该数据集包含来自多个不同语言的文本数据,记录了多种语言的自然语言文本内容。主要特征如下: 时间跨度:...
    packageimg
  • Gojek乘客满意度分析数据集GojekSentimentAnalysisDataset-ahmadamanuladib

    2025年4月24日   

    Gojek乘客满意度分析数据集GojekSentimentAnalysisDataset-ahmadamanuladib 数据来源:互联网公开数据 标签:Gojek, 乘客满意度, 评论分析, 数据集, 自然语言处理, 机器学习, 交通出行, 用户反馈...
    packageimg
  • 克莱德制作数据集2Claude-madeDatasets2-patricknormile

    2025年4月24日   

    克莱德制作数据集2Claude-madeDatasets2-patricknormile 数据来源:互联网公开数据 标签:数据集,机器学习,自然语言处理,人工智能,文本分析,数据挖掘,深度学习,模型训练 数据概述: 该数据集由克莱德团队制作,包含了丰富的文本数据资源,适用于自然语言处理,机器学习和人工智能领域的应用。主要特征如下:...
    packageimg
  • 科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan

    2025年4月24日   

    科学考试语言模型数据集LLMScienceExamDatasetwithContext500W-ranchantan 数据来源:互联网公开数据 标签:语言模型,科学考试,数据集,机器学习,自然语言处理,教育,考试评估,知识图谱 数据概述:该数据集包含来自Kaggle的科学考试数据,记录了包含上下文信息的科学考试题及其答案。主要特征如下:...
    packageimg
  • 印度Reddit社区讨论数据r-IndiaSubredditData-charaiveti

    2025年4月24日   

    印度Reddit社区讨论数据r-IndiaSubredditData-charaiveti 数据来源:互联网公开数据 标签:社交媒体,Reddit,印度,社区分析,文本挖掘,自然语言处理,情感分析,舆情分析 数据概述:...
    packageimg
  • 板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa

    2025年4月24日   

    板球比赛文本数据集CricinfoTextDataset-nitinkumarbairwa 数据来源:互联网公开数据 标签:板球,体育,数据集,文本分析,机器学习,自然语言处理,体育新闻,赛事报道 数据概述: 该数据集包含来自Cricinfo网站的比赛文本数据,记录了板球比赛的相关信息。主要特征如下:...
    packageimg
  • 绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya

    2025年4月24日   

    绝命毒师情景喜剧数据集BreakingBadSitcomDataset-shilpibhattacharyya 数据来源:互联网公开数据 标签:情景喜剧,电视剧,数据集,文本分析,角色互动,剧本分析,自然语言处理,文化研究 数据概述: 该数据集包含了电视剧《绝命毒师》的情景喜剧相关数据,记录了剧集中对话,场景和角色互动等信息。主要特征如下: 时间跨度:...
    packageimg
  • 多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan

    2025年4月24日   

    多语言文本情绪识别数据集Multi-lingualTextEmotionRecognitionDataset-naseerahmedkhan 数据来源:互联网公开数据 标签:多语言,文本分析,情绪识别,情感计算,自然语言处理,机器学习,心理学,数据集 数据概述:该数据集包含来自多个来源的多语言文本数据,记录了不同语言文本中的情绪标注。主要特征如下:...
    packageimg
  • 代码数据集CodeDataDataset-hozaifazaki99

    2025年4月24日   

    代码数据集CodeDataDataset-hozaifazaki99 数据来源:互联网公开数据 标签:代码,数据集,编程,软件开发,机器学习,自然语言处理,代码分析,软件工程 数据概述:该数据集包含来自互联网公开资源的代码数据,记录了不同编程语言的代码片段和项目。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530

    2025年4月24日   

    谷歌问答数据集扩展GoogleQUESTQAAdd-onDataset-jasperwang530 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,机器学习,文本分析,人工智能,语义理解,信息检索 数据概述: 该数据集是谷歌问答数据集的扩展版本,包含来自谷歌问答社区的问答数据,记录了用户提交的问题及其对应的回答内容。主要特征如下:...
    packageimg
  • 多模态文本摘要数据集MT-SummDataset-gsaichaitanya

    2025年4月24日   

    多模态文本摘要数据集MT-SummDataset-gsaichaitanya 数据来源:互联网公开数据 标签:多模态数据,文本摘要,数据集,自然语言处理,深度学习,机器学习,多媒体分析,信息检索 数据概述: 该数据集包含来自多个来源的多模态文本摘要数据,记录了图像和相应文本的摘要信息。主要特征如下:...
    packageimg
  • 样本训练数据集-ahmedmohammed244

    2025年4月24日   

    样本训练数据集-ahmedmohammed244 数据来源:互联网公开数据 标签:机器学习,训练数据,数据集,模型构建,数据预处理,数据分析,人工智能,自然语言处理 数据概述: 该数据集包含用于机器学习模型训练的样本数据,记录了多种类型的样本信息。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于样本的产生时间。...
    packageimg
  • 常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd

    2025年4月24日   

    常见教育文本预处理数据集PreprocessCommonLitDataset-mkhoatd 数据来源:互联网公开数据 标签:教育研究,文本预处理,数据集,自然语言处理,机器学习,教育技术,文本分析,学术资源 数据概述: 该数据集包含来自CommonLit教育平台的数据,记录了常见教育文本的预处理信息。主要特征如下:...
    packageimg
  • 推特推文情感分析数据集Dril-GPT2TweetsDataset-jehant

    2025年4月24日   

    推特推文情感分析数据集Dril-GPT2TweetsDataset-jehant 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,文本挖掘,机器学习,自然语言处理,情感计算,数据科学 数据概述: 该数据集包含来自推特(Twitter)平台的大量推文数据,主要记录了用户发布的文本内容及其情感倾向。主要特征如下:...
    packageimg