找到3,868个数据集

标签: 文本分类

过滤结果
  • 独立日2020机器学习黑客马拉松研究文章主题建模数据集

    2025年4月26日   

    独立日2020机器学习黑客马拉松研究文章主题建模数据集 数据来源:互联网公开数据 标签:研究文章,主题建模,机器学习,科学文献,学术分析,文本分类,多主题识别 数据概述:...
    packageimg
  • Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308

    2025年4月26日   

    Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,情感分析,数据挖掘,多语言,文本标注 数据概述:...
    packageimg
  • 情感分类数据集EmotionClassifierDataset-shauryavardhan1

    2025年4月26日   

    情感分类数据集EmotionClassifierDataset-shauryavardhan1 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,数据挖掘,人工智能 数据概述: 该数据集包含来自互联网公开渠道的情感分类数据,记录了文本内容的情感倾向。主要特征如下: 时间跨度:数据记录的时间范围为近五年。...
    packageimg
  • 多类别情感分析数据集-sarath02003

    2025年4月26日   

    多类别情感分析数据集-sarath02003 数据来源:互联网公开数据 标签:情感分析,文本分类,机器学习,自然语言处理,情感识别,数据集,NLP,情绪分析 数据概述: 该数据集包含了用于多类别情感分析的文本数据。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本。 地理范围:数据来源多样,不局限于特定地区。...
    packageimg
  • 文本情感分析数据集TextSentimentAnalysisDatasetV2-ahmedeabozaid

    2025年4月26日   

    文本情感分析数据集TextSentimentAnalysisDatasetV2-ahmedeabozaid 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,大数据,人工智能,数据挖掘 数据概述: 该数据集包含来自互联网公开数据的文本情感分析数据,记录了不同文本内容所表达的情感倾向。主要特征如下:...
    packageimg
  • 笑话内容分类数据集JokesDataset-yaroslav62

    2025年4月26日   

    笑话内容分类数据集JokesDataset-yaroslav62 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,幽默分析,机器学习,情感分析,娱乐内容,语言模型 数据概述: 该数据集包含来自互联网的笑话内容数据,记录了各类笑话的文本信息及其相关分类标签。主要特征如下:...
    packageimg
  • 垃圾邮件识别数据集SpamMailDataset-anandpanda3

    2025年4月26日   

    垃圾邮件识别数据集SpamMailDataset-anandpanda3 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,自然语言处理,机器学习,邮件过滤,信息安全,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于训练和评估垃圾邮件识别模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了邮件的历史数据。...
    packageimg
  • 推特性别歧视检测数据集TwitterSexismDetectionDataset-giseledacosta

    2025年4月26日   

    推特性别歧视检测数据集TwitterSexismDetectionDataset-giseledacosta 数据来源:互联网公开数据 标签:社交媒体,性别歧视,自然语言处理,文本分类,数据集,情感分析,机器学习,社会学 数据概述: 该数据集包含来自推特(Twitter)平台的推文数据,用于研究和检测性别歧视言论。主要特征如下:...
    packageimg
  • 有害言论检测数据集ToxicSemEvalData-izuna385

    2025年4月26日   

    有害言论检测数据集ToxicSemEvalData-izuna385 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,有害内容检测,社交媒体,文本分析 数据概述: 该数据集包含来自 SemEval 2017 竞赛的数据,主要用于有害言论的检测与分类。主要特征如下: 时间跨度:数据记录的时间范围为 SemEval...
    packageimg
  • 虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant

    2025年4月26日   

    虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息,自然语言处理,机器学习,文本分类,信息传播,网络安全 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻的真实性分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2019年。...
    packageimg
  • 对话意图分类数据集-anandnakat

    2025年4月26日   

    对话意图分类数据集-anandnakat 数据来源:互联网公开数据 标签:自然语言处理,对话系统,意图识别,数据集,机器学习,文本分类,人工智能,对话分析 数据概述: 该数据集包含用于对话意图分类的文本数据,记录了用户在对话中的各种表达方式及其对应的意图类别。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...
    packageimg
  • 宗派语言与普通语言对比数据集

    2025年4月26日   

    宗派语言与普通语言对比数据集 数据来源:互联网公开数据 标签:宗派语言,普通语言,文本分类,自然语言处理,宗教文本,情感分析,社会研究 数据概述 本数据集包含两部分内容:宗派语言部分和普通语言部分。 宗派语言部分:收集了来自多个宗派领袖的演讲、会议记录和书面作品,包括但不限于《天命之书》(由Abdrushin撰写)、天堂之门(Heaven’s...
    packageimg
  • 六种情绪识别数据集-rahulshelke98

    2025年4月26日   

    六种情绪识别数据集-rahulshelke98 数据来源:互联网公开数据 标签:情绪识别,情感分析,数据集,机器学习,自然语言处理,文本分类,语音识别,人工智能 数据概述: 该数据集包含多种文本和语音数据,用于训练和评估情绪识别模型,涵盖了六种基本情绪。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的情绪表达。...
    packageimg
  • 灾难推文自然语言处理数据集NLPDisasterTweetsDataset-dnyaneshwalwadkar

    2025年4月26日   

    灾难推文自然语言处理数据集NLPDisasterTweetsDataset-dnyaneshwalwadkar 数据来源:互联网公开数据 标签:自然语言处理,灾难推文,数据集,文本分类,机器学习,情感分析,推特,危机管理 数据概述:...
    packageimg
  • UIT问答数据集UITQADataset-callmelee117

    2025年4月26日   

    UIT问答数据集UITQADataset-callmelee117 数据来源:互联网公开数据 标签:问答系统,自然语言处理,数据集,文本分类,机器学习,智能对话,语言模型,人工智能 数据概述: 该数据集来自UIT问答系统项目,记录了用户提出的问题和对应的答案,适用于问答系统开发,文本分类和智能对话研究。主要特征如下:...
    packageimg
  • YouTube垃圾评论预处理数据集YouTubeSpamCommentPre-processedDataset-mdmhnayeem

    2025年4月26日   

    YouTube垃圾评论预处理数据集YouTubeSpamCommentPre-processedDataset-mdmhnayeem 数据来源:互联网公开数据 标签:社交媒体,垃圾评论,数据集,文本分类,机器学习,自然语言处理,内容审核,数据挖掘 数据概述:...
    packageimg
  • 文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro

    2025年4月26日   

    文本分类预训练模型微调数据集Fine-tuneLLMTextClassificationPreprocessedDataset-agakitaro 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,深度学习,预训练模型,语言模型,模型微调 数据概述:...
    packageimg
  • 自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija

    2025年4月26日   

    自然语言处理博客文章数据集BlogArticlesforNLPDataset-dimplebathija 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,文本分类,情感分析,文本挖掘,人工智能 数据概述: 该数据集包含来自各类博客平台的文章数据,记录了不同主题和内容的博客文章信息。主要特征如下:...
    packageimg
  • Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17

    2025年4月26日   

    Quora问题分类数据集QuoraQuestionsFinalSubmissionDataset-priyamsaha17 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,问答系统,信息检索,数据挖掘,人工智能 数据概述:...
    packageimg
  • 情感分析平衡数据集6-EmotionBalancedData-rahulshelke98

    2025年4月26日   

    情感分析平衡数据集6-EmotionBalancedData-rahulshelke98 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,心理学,数据平衡,情感识别 数据概述: 该数据集包含来自社交媒体,评论网站等公开渠道的文本数据,记录了包含六种基本情感(喜怒哀乐惊恐)的文本片段。主要特征如下:...
    packageimg