找到3,865个数据集

标签: 文本分类

过滤结果
  • 情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf

    2025年4月24日   

    情感倾向二元分类数据集BinarySST-2Dataset-jgggjkmf 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,NLP,二分类,情感倾向 数据概述: 该数据集包含来自斯坦福情感树库(Stanford Sentiment Treebank, SST)的情感倾向分类数据,记录了句子的情感极性。主要特征如下:...
    packageimg
  • 垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab

    2025年4月24日   

    垃圾邮件检测语料库数据集SpamAssassinCorpusDataset-shobhab 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,数据集,机器学习,邮件过滤,文本分析,信息检索 数据概述:该数据集包含来自SpamAssassin项目的邮件数据,用于训练和测试垃圾邮件过滤系统。主要特征如下:...
    packageimg
  • 摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine

    2025年4月24日   

    摩洛哥社交媒体推文分类数据集TweetClassificationMoroccanDataset-omarlamine 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,情感分析,机器学习,自然语言处理,情感研究,多语言处理 数据概述:该数据集包含来自摩洛哥社交媒体平台的推文数据,记录了用户发布的推文内容及情感倾向。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-sophiamatskovych 数据来源:互联网公开数据 标签:新闻分析,虚假新闻,数据集,文本分类,机器学习,自然语言处理,传播学,信息安全 数据概述: 该数据集包含来自互联网公开渠道的新闻文章数据,记录了真假新闻的特征和标签。主要特征如下:...
    packageimg
  • 多分类电子邮件数据集-amalverma27

    2025年4月24日   

    多分类电子邮件数据集-amalverma27 数据来源:互联网公开数据 标签:电子邮件,文本分类,垃圾邮件检测,自然语言处理,机器学习,数据集,邮件安全,信息检索 数据概述: 该数据集包含电子邮件数据,旨在用于文本分类和垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间跨度不明确,但包含历史邮件数据。...
    packageimg
  • 语言识别数据集LanguageDetectorDataset-meet07824

    2025年4月24日   

    语言识别数据集LanguageDetectorDataset-meet07824 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,机器学习,文本分类,多语言,人工智能,数据分析 数据概述: 该数据集包含来自公开来源的语言识别数据,记录了不同语言的文本样本及其对应的语言标签。主要特征如下:...
    packageimg
  • 电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab

    2025年4月24日   

    电影评论情感分析数据集IMDBMoviesReviewDatasetforSentimentAnalysis-muhammadumairab 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,电影评论,深度学习,人工智能...
    packageimg
  • 假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn

    2025年4月24日   

    假新闻识别数据集FNC-1-FakeNewsChallenge-hnganhtrn 数据来源:互联网公开数据 标签:假新闻,新闻,文本分析,自然语言处理,机器学习,情感分析,信息检索,文本分类 数据概述: 该数据集来自假新闻挑战赛(Fake News Challenge,FNC-1),旨在促进假新闻的自动检测和识别。主要特征如下:...
    packageimg
  • 推文训练数据集Tweets-TrainDataset-priyankacheruku

    2025年4月24日   

    推文训练数据集Tweets-TrainDataset-priyankacheruku 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,机器学习,自然语言处理,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的文本内容和相关情感标签。主要特征如下:...
    packageimg
  • 孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse

    2025年4月24日   

    孟加拉语文本情感分析数据集BanglaTextSentimentAnalysisDataset-raihancse 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,孟加拉语,文本分类,机器学习,情感识别,文本挖掘 数据概述: 该数据集包含孟加拉语文本数据,用于情感分析任务,旨在识别和分类文本中的情感倾向。主要特征如下:...
    packageimg
  • 文本分类2022数据集DF-Classify2022-huynhtruc109

    2025年4月24日   

    文本分类2022数据集DF-Classify2022-huynhtruc109 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,深度学习,文本分析,人工智能,数据科学 数据概述: 该数据集包含来自2022年的文本分类数据,记录了不同类别文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为2022年。...
    packageimg
  • 语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey

    2025年4月24日   

    语言检测数据集2010-2020年文本语言识别数据集-mogazeyalmogazey 数据来源:互联网公开数据 标签:语言检测,文本分析,数据集,自然语言处理,机器学习,多语言识别,文本分类,人工智能 数据概述: 该数据集包含来自不同来源的文本数据,记录了多种语言的文本样本,适用于语言检测和识别任务。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-wbq030607 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,文本分类,机器学习,信息传播,媒体研究,自然语言处理 数据概述: 该数据集包含来自互联网公开渠道的虚假新闻数据,记录了新闻标题,内容,发布时间,来源等信息。主要特征如下:...
    packageimg
  • 意图分类数据集IntentClassifierDataset-interviewturabit

    2025年4月24日   

    意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 简化虚假新闻数据集

    2025年4月24日   

    简化虚假新闻数据集 数据来源:互联网公开数据 标签:虚假新闻,文本分类,NLP,二分类问题,数据清洗,特征提取,新闻真实性分析 数据概述: 本数据集是虚假新闻与真实新闻数据集的简化版本,旨在为文本分类任务提供训练集。数据集已标注,包含真实新闻与虚假新闻的文本内容,适合作为自然语言处理(NLP)任务的基础数据。数据集经过初步处理,确保数据质量与一致性。...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:...
    packageimg
  • 孟加拉语仇恨言论与俚语数据集-arkabhattachajee01

    2025年4月24日   

    孟加拉语仇恨言论与俚语数据集-arkabhattachajee01 数据来源:互联网公开数据 标签:仇恨言论,俚语,孟加拉语,自然语言处理,文本分类,情感分析,社交媒体,语言学 数据概述: 该数据集包含了孟加拉语社交媒体上的仇恨言论,其中部分言论使用了俚语。主要特征如下: 时间跨度:数据记录的时间范围未知,但通常反映了社交媒体上的近期言论。...
    packageimg
  • 英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608

    2025年4月24日   

    英国广播公司BBC新闻文本数据集BBCNewsTextDataset-krishnaprasad2608 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,机器学习,文本分类,信息检索,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本,涵盖多个新闻类别。主要特征如下:...
    packageimg
  • 合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701

    2025年4月24日   

    合同条款分析数据集CUAD-Master-ClausesDataset-akashrai1701 数据来源:互联网公开数据 标签:法律文本,合同分析,数据集,自然语言处理,机器学习,法律研究,文本分类,智能合约 数据概述: 该数据集包含来自 CUAD(Contract Understanding...
    packageimg