找到11,786个数据集

标签: 自然语言处理

过滤结果
  • 卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit

    2025年4月23日   

    卡纳达语新闻分类数据集KannadaNewsCategoryDataset-vigneshvit 数据来源:互联网公开数据 标签:新闻分类,卡纳达语,数据集,文本分析,机器学习,自然语言处理,多语言处理,信息检索 数据概述: 该数据集记录了卡纳达语新闻文章的分类信息,适用于新闻分类,文本分析和机器学习任务。主要特征如下:...
    packageimg
  • 辩论场景句子数据集DebateSentencesDataset-vdudani

    2025年4月23日   

    辩论场景句子数据集DebateSentencesDataset-vdudani 数据来源:互联网公开数据 标签:辩论,句子,文本分析,自然语言处理,数据集,情感分析,语言学,机器学习 数据概述: 该数据集包含了从公开辩论场景中提取的句子,旨在用于文本分析和自然语言处理任务。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的辩论场景。...
    packageimg
  • 虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra

    2025年4月23日   

    虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,自然语言处理,信息传播,媒体研究,数据分析 数据概述:...
    packageimg
  • 柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana

    2025年4月23日   

    柯南侦探对话数据集DetectiveConanConversationDataset-jiarandiiana 数据来源:互联网公开数据 标签:侦探小说,对话数据,数据集,自然语言处理,机器学习,文本分析,文化研究,推理小说 数据概述: 该数据集包含来自柯南(Detective...
    packageimg
  • Shopee电商平台用户评论数据集ShopeeE-commercePlatformUserReviewDataset-herafajrin

    2025年4月23日   

    Shopee电商平台用户评论数据集ShopeeE-commercePlatformUserReviewDataset-herafajrin 数据来源:互联网公开数据 标签:电商,用户评论,数据集,情感分析,自然语言处理,机器学习,商业智能,数据挖掘 数据概述:...
    packageimg
  • 亚马逊商品评论数据集AmazonItemReviewDataset-pranavagrawal09

    2025年4月23日   

    亚马逊商品评论数据集AmazonItemReviewDataset-pranavagrawal09 数据来源:互联网公开数据 标签:电商,评论数据,情感分析,自然语言处理,推荐系统,用户行为,数据集,文本挖掘 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了用户对商品的评价和相关信息。主要特征如下:...
    packageimg
  • 数据30种阿拉伯字母分类数据集详解

    2025年4月23日   

    标题:30种阿拉伯字母分类数据集详解 数据内容: 该数据集包含了30种不同的阿拉伯字母及其对应的分类标识。数据集主要包括以下两个字段: 1. Class_ID:表示每个阿拉伯字母对应的分类标识。 2. Arabic_Letter:表示具体的阿拉伯字母。 数据来源: 互联网公开数据 数据用途: 该数据集可以用于多个行业的研究与应用: 1....
    packageimg
  • BBC新闻内容数据集BBCNewsContentDataset-malwyshihab

    2025年4月23日   

    BBC新闻内容数据集BBCNewsContentDataset-malwyshihab 数据来源:互联网公开数据 标签:新闻,媒体内容,数据集,文本分析,自然语言处理,机器学习,新闻分类,信息挖掘 数据概述: 该数据集包含来自BBC新闻网站的文章数据,记录了BBC发布的各类新闻文章的文本内容和相关信息。主要特征如下:...
    packageimg
  • 孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087

    2025年4月23日   

    孟加拉数学问题文本数据集BanglaMathProblemCOTDataset-mushfiqurrahman6087 数据来源:互联网公开数据 标签:数学问题,数据集,孟加拉语,COT,问题解答,自然语言处理,机器翻译,教育 数据概述: 该数据集包含孟加拉语数学问题的文本数据,旨在用于问题解答和自然语言处理任务。主要特征如下:...
    packageimg
  • 语音识别技术评估数据集AshkanASRDataset-melikasaadi

    2025年4月23日   

    语音识别技术评估数据集AshkanASRDataset-melikasaadi 数据来源:互联网公开数据 标签:语音识别,自动化语音识别,数据集,自然语言处理,机器学习,人工智能,声音处理,音视频技术 数据概述:该数据集包含来自Ashkan ASR项目的语音识别数据,记录了不同语音样本的音频特征和对应的文本转录。主要特征如下:...
    packageimg
  • 矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir

    2025年4月23日   

    矛盾侦探沃森训练集上采样版ContradictoryMyDearWatsonTrainUpsampled数据集-hatemalamir 数据来源:互联网公开数据 标签:自然语言处理,矛盾检测,数据集,人工智能,机器学习,文本分析,情感分析,多语言支持 数据概述: 该数据集为Contradictory My Dear...
    packageimg
  • ZAC数学竞赛试题数据集ZACMathCompetitionDataset-mp0suy

    2025年4月23日   

    ZAC数学竞赛试题数据集ZACMathCompetitionDataset-mp0suy 数据来源:互联网公开数据 标签:数学竞赛,数据集,数学教育,问题解答,机器学习,自然语言处理,数学建模,学术资源 数据概述: 该数据集收录了来自ZAC数学竞赛的试题,涵盖了不同年份和难度的数学题目。主要特征如下:...
    packageimg
  • 英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad

    2025年4月23日   

    英法语言对比数据集EnglishandFrenchLanguageComparisonDataset-jayantiprasad 数据来源:互联网公开数据 标签:语言学,数据集,对比分析,翻译,自然语言处理,机器学习,学术资源,语言研究 数据概述:该数据集包含来自互联网的英法语言对比数据,记录了英语和法语在词汇,语法,语义等方面的不同点。主要特征如下:...
    packageimg
  • 词典数据集LexiconDataDataset-cakrulgaming

    2025年4月23日   

    词典数据集LexiconDataDataset-cakrulgaming 数据来源:互联网公开数据 标签:词典,数据集,自然语言处理,语言学,词汇研究,文本分析,教育,机器学习 数据概述: 该数据集包含来自多个来源的词典数据,记录了大量词汇的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从20世纪初到现代。...
    packageimg
  • 谷歌Play商店应用评论数据集GooglePlayStoreAppReviewsDataset-georgetonmoy

    2025年4月23日   

    谷歌Play商店应用评论数据集GooglePlayStoreAppReviewsDataset-georgetonmoy 数据来源:互联网公开数据 标签:应用评论,数据集,自然语言处理,用户反馈,移动应用,市场分析,消费者行为,数据分析 数据概述:该数据集包含来自谷歌Play商店的应用评论数据,记录了用户对各种应用的评论信息。主要特征如下:...
    packageimg
  • 大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef

    2025年4月23日   

    大型语言模型Mistral7B指令文本数据集LLMMistral7BInstructTextsDataset-wu468ef 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本生成,语言模型,指令学习,人工智能,深度学习 数据概述: 该数据集包含来自Mistral...
    packageimg
  • 路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek

    2025年4月23日   

    路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek 数据来源:互联网公开数据 标签:新闻文本,多标签分类,文本分类,路透社,机器学习,自然语言处理,主题分类 数据概述:...
    packageimg
  • 英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn

    2025年4月23日   

    英文标点符号识别与光学字符识别数据集Punctuation-EN-OCRDataset-thnhhunhtn 数据来源:互联网公开数据 标签:自然语言处理,光学字符识别,数据集,文本分析,机器学习,计算机视觉,语言技术,符号识别 数据概述:...
    packageimg
  • 智能问答聊天机器人训练与评估数据集QAChatbotDataset-arhamyousufzai

    2025年4月23日   

    智能问答聊天机器人训练与评估数据集QAChatbotDataset-arhamyousufzai 数据来源:互联网公开数据 标签:自然语言处理,智能客服,数据集,机器学习,对话系统,文本分析,人工智能,对话训练 数据概述: 该数据集包含用于训练和评估智能问答聊天机器人的对话数据,记录了用户与机器人之间的问答交互内容。主要特征如下:...
    packageimg
  • 情绪识别文本数据集EmotionTextDataset-rimshajanjua

    2025年4月23日   

    情绪识别文本数据集EmotionTextDataset-rimshajanjua 数据来源:互联网公开数据 标签:情绪识别,文本数据,自然语言处理,机器学习,情感分析,数据集,人工智能,文本挖掘 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同情绪标签的文本样本。主要特征如下: 时间跨度: 数据记录的时间范围从2010年到2022年。...
    packageimg