找到11,784个数据集

标签: 自然语言处理

过滤结果
  • 词性标注数据集POSTaggingDataset-hiuanh

    2025年4月22日   

    词性标注数据集POSTaggingDataset-hiuanh 数据来源:互联网公开数据 标签:自然语言处理,词性标注,数据集,文本分析,机器学习,语言模型,文本挖掘,计算机语言学 数据概述: 该数据集专注于词性标注任务,包含大量文本样本及其对应的词性标签。主要特征如下: 时间跨度:数据记录的时间范围未明确,但数据集内容通常反映通用语言特征。...
    packageimg
  • 新闻组文本分类数据集20NewsgroupsDataset-aniket13r

    2025年4月22日   

    新闻组文本分类数据集20NewsgroupsDataset-aniket13r 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,新闻,文本分析,主题建模,信息检索 数据概述: 该数据集包含了大约20,000篇新闻组文档,涵盖了20个不同的新闻组主题。主要特征如下: 时间跨度:数据收集的时间范围大约在1990年代初期。...
    packageimg
  • Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra

    2025年4月22日   

    Netflix评论情感分析数据集NetflixReviewsSentimentDataset-parthbatra 数据来源:互联网公开数据 标签:情感分析,Netflix,评论,数据集,自然语言处理,文本分析,机器学习,用户行为 数据概述: 该数据集包含来自 Netflix 用户的评论数据,并标注了情感极性。主要特征如下:...
    packageimg
  • 搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024

    2025年4月22日   

    搞笑段子数据集CombinedGoodJokesDataset-ihdufxr2024 数据来源:互联网公开数据 标签:幽默,段子,笑话,数据集,自然语言处理,文本分析,情感分析,娱乐 数据概述: 该数据集包含了来自多个来源的搞笑段子,旨在提供一个用于文本分析和自然语言处理的资源。主要特征如下:...
    packageimg
  • YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee

    2025年4月22日   

    YouTube评论分类与垃圾评论识别数据集YouTubeSpamClassifiedCommentsDataset-goneee 数据来源:互联网公开数据 标签:社交媒体,评论分析,数据集,垃圾评论,机器学习,自然语言处理,文本分类,信息过滤 数据概述:...
    packageimg
  • 阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74

    2025年4月22日   

    阿拉伯语推特情感数据集阿拉伯语推特情感数据集-mohamedelashry74 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,阿拉伯语,社交媒体研究 数据概述: 该数据集包含来自推特的阿拉伯语文本数据,记录了用户发布的推文及其对应的情感标签。主要特征如下:...
    packageimg
  • 银行业务问题分类数据集BankingTransactionsQuestionClassificationDataset-abhaygotmare

    2025年4月22日   

    银行业务问题分类数据集BankingTransactionsQuestionClassificationDataset-abhaygotmare 数据来源:互联网公开数据 标签:银行业务,问题分类,数据集,自然语言处理,机器学习,客户服务,金融分析,客户支持...
    packageimg
  • 医疗问答自然语言处理数据集MedQuadNLPDataset-dibyasankhapal

    2025年4月22日   

    医疗问答自然语言处理数据集MedQuadNLPDataset-dibyasankhapal 数据来源:互联网公开数据 标签:医疗问答,自然语言处理,数据集,机器学习,医学信息,健康咨询,文本分析,人工智能 数据概述: 该数据集包含来自医疗问答平台的数据,记录了用户与医疗专家之间的交互问答,适用于自然语言处理,医疗信息提取等任务。主要特征如下:...
    packageimg
  • 推特PfizerCOVID-19疫苗公众情绪分析数据集-2021-gallo33henrique

    2025年4月22日   

    推特PfizerCOVID-19疫苗公众情绪分析数据集-2021-gallo33henrique 数据来源:互联网公开数据 标签:推特, Pfizer, COVID-19, 疫苗, 公众情绪, 情感分析, 数据科学, 自然语言处理 数据概述: 本数据集包含从Twitter收集的与Pfizer...
    packageimg
  • 十大说唱歌手作品文本分析数据集-2023-ngxdtv

    2025年4月22日   

    十大说唱歌手作品文本分析数据集-2023-ngxdtv 数据来源:互联网公开数据 标签:说唱音乐,文本分析,自然语言处理,机器学习,文本分类,情感分析,主题建模,文本生成,语言模型,语音识别 数据概述: 本数据集包含超过2600首由十个不同说唱歌手创作的作品文本,其中包括Ali As、Alligatoah、Kollegah和Kool...
    packageimg
  • Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea

    2025年4月22日   

    Medium应用商店用户评论情感分析数据集-GooglePlay商店-英语-时间不限-raqhea 数据来源:互联网公开数据 标签:Medium,应用评论,用户反馈,情感分析,订阅,内容,界面,用户体验,roBERTa,自然语言处理,文本分类 数据概述: 本数据集包含了从Google...
    packageimg
  • 电子邮件垃圾邮件分类数据集EmailHamSpamDataset-hamedetezadi

    2025年4月22日   

    电子邮件垃圾邮件分类数据集EmailHamSpamDataset-hamedetezadi 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,数据集,分类算法,机器学习,文本分析,自然语言处理,数据挖掘 数据概述: 该数据集包含来自电子邮件系统的邮件数据,记录了邮件内容及其分类标签(垃圾邮件或正常邮件)。主要特征如下:...
    packageimg
  • 印度孟加拉语自由诗歌数据集2021-truthr

    2025年4月22日   

    印度孟加拉语自由诗歌数据集2021-truthr 数据来源:互联网公开数据 标签:孟加拉语,诗歌,数据集,免费资源,自然语言处理,文本生成,预训练模型,下游任务,CC-BY-SA 4.0 数据概述:...
    packageimg
  • 达拉兹电商平台商品标注标准化数据集-ahtshamrao

    2025年4月22日   

    达拉兹电商平台商品标注标准化数据集-ahtshamrao 数据来源:互联网公开数据 标签:电商,商品,标注,数据集,自然语言处理,文本分类,机器学习,商品推荐 数据概述: 该数据集包含了来自达拉兹(Daraz)电商平台的商品数据,这些数据经过了标准化处理和人工标注,主要记录了商品的基本信息和详细描述。主要特征如下:...
    packageimg
  • 阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889

    2025年4月22日   

    阿拉伯语句子数据集ArabicSentencesDataset-ahmedtaha8889 数据来源:互联网公开数据 标签:阿拉伯语,自然语言处理,数据集,文本分析,机器翻译,语言模型,文本语料库,语言学 数据概述: 该数据集包含超过70万条阿拉伯语句子,旨在为自然语言处理(NLP)任务提供丰富的文本语料库。主要特征如下:...
    packageimg
  • Reddit笑话数据集RedditJokesDataset-vishnuprksh

    2025年4月22日   

    Reddit笑话数据集RedditJokesDataset-vishnuprksh 数据来源:互联网公开数据 标签:笑话,Reddit,文本数据,自然语言处理,情感分析,社交媒体,机器学习,幽默 数据概述: 该数据集包含来自Reddit平台的笑话数据,记录了用户发布的各种类型的笑话及其相关信息。主要特征如下:...
    packageimg
  • 推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam

    2025年4月22日   

    推特客户服务数据集CustomerSupportonTwitterDataset-aminaslam 数据来源:互联网公开数据 标签:客户服务,推特,社交媒体,数据集,情感分析,文本挖掘,自然语言处理,数据分析 数据概述: 该数据集包含来自推特平台上的客户服务相关数据,记录了用户与品牌之间的互动情况。主要特征如下:...
    packageimg
  • 肺炎患者病历报告数据集PneumoniaMIMICReportsDataset-wasifnafee

    2025年4月22日   

    肺炎患者病历报告数据集PneumoniaMIMICReportsDataset-wasifnafee 数据来源:互联网公开数据 标签:医疗健康,病历分析,肺炎,数据集,自然语言处理,临床研究,人工智能,医学影像 数据概述: 该数据集包含来自大规模医疗数据库MIMIC(Medical Information Mart for Intensive...
    packageimg
  • 美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah

    2025年4月22日   

    美国专利短语数据扩充与翻译数据集USPatentPhraseDataAugmentationandTranslationDataset-tauilabdelilah 数据来源:互联网公开数据 标签:专利数据,数据扩充,机器翻译,自然语言处理,数据集,文本分析,创新研究,知识产权...
    packageimg
  • 英印机器翻译练习数据集-arunmohan003

    2025年4月22日   

    英印机器翻译练习数据集-arunmohan003 数据来源:互联网公开数据 标签:机器翻译,英印翻译,语言数据,练习数据,自然语言处理,NLP,样本数据 数据概述:...
    packageimg