找到3,868个数据集

标签: 文本分类

过滤结果
  • 推特仇恨言论情感分析数据集TwitterHateSpeechSentimentsDataset-muhamadfaheem88

    2025年4月26日   

    推特仇恨言论情感分析数据集TwitterHateSpeechSentimentsDataset-muhamadfaheem88 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,仇恨言论,文本分类,数据挖掘 数据概述: 该数据集包含来自推特的仇恨言论情感数据,记录了用户在推特上发表的言论及其情感倾向。主要特征如下:...
    packageimg
  • 日常对话数据集DailyDialogCleanDataset-va6573

    2025年4月26日   

    日常对话数据集DailyDialogCleanDataset-va6573 数据来源:互联网公开数据 标签:对话数据,自然语言处理,数据集,情感分析,文本分类,机器学习,语言模型,人机交互 数据概述: 该数据集包含来自日常对话的文本数据,记录了不同场景下的对话内容。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为日常对话的文本记录。...
    packageimg
  • 自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613

    2025年4月26日   

    自然语言处理任务数据集NLPAssignment4Dataset-onkarsawant5613 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器翻译,情感分析,文本分类,深度学习,语言模型 数据概述:该数据集包含用于自然语言处理任务的文本数据,涵盖了多种语言和任务类型。主要特征如下:...
    packageimg
  • 科技新闻文本分类数据集TRTHaberTechnologyDataset-denizhanahin

    2025年4月26日   

    科技新闻文本分类数据集TRTHaberTechnologyDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,文本分类,数据集,机器学习,自然语言处理,信息抽取,数据挖掘,人工智能 数据概述: 该数据集包含来自科技新闻网站TRT Haber的文本数据,记录了科技领域的新闻报道。主要特征如下:...
    packageimg
  • 越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat

    2025年4月26日   

    越南语情感分析数据集VietnameseSentimentAnalysisDataset-vominhdat 数据来源:互联网公开数据 标签:情感分析,越南语,自然语言处理,文本分类,机器学习,情感极性,数据集,语言学 数据概述:该数据集包含来自越南语文本的情感标注数据,主要用于情感分析任务。主要特征如下:...
    packageimg
  • 情感分类-6类别数据集

    2025年4月26日   

    情感分类-6类别数据集 数据来源:互联网公开数据 标签:情感分析,推文数据,分类模型,自然语言处理,亲密程度,文本分类 数据概述: 本数据集整合了来自Sentiment140和Cardiff...
    packageimg
  • 过滤推文数据集

    2025年4月26日   

    过滤推文数据集 数据来源:互联网公开数据 标签:推文,社交媒体,文本分析,自然语言处理,情绪分析,用户行为,MBTI人格类型,文本分类 数据概述:...
    packageimg
  • 周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas

    2025年4月26日   

    周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,数据科学,情感识别,文本分类 数据概述:...
    packageimg
  • 医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa

    2025年4月26日   

    医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:...
    packageimg
  • 通用语言理解评估数据集GLUEDataset-ankitchettri

    2025年4月26日   

    通用语言理解评估数据集GLUEDataset-ankitchettri 数据来源:互联网公开数据 标签:自然语言处理,语言理解,数据集,机器学习,文本分类,语义分析,人工智能,深度学习 数据概述: 该数据集为通用语言理解评估(GLUE)项目提供的数据集,包含多种自然语言处理任务的数据,记录了不同语言理解任务的数据样本。主要特征如下:...
    packageimg
  • 马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu

    2025年4月26日   

    马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu 数据来源:互联网公开数据 标签:新闻,语言分析,数据集,自然语言处理,文本分类,机器学习,印度语言,数据挖掘 数据概述: 该数据集包含来自马拉地语新闻媒体的文章,记录了马拉地语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2018年。...
    packageimg
  • 数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050

    2025年4月26日   

    2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:...
    packageimg
  • 文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn

    2025年4月26日   

    文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:...
    packageimg
  • 短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad

    2025年4月26日   

    短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad 数据来源:互联网公开数据 标签:短信,垃圾邮件,数据集,自然语言处理,文本分类,机器学习,数据挖掘,信息安全 数据概述: 该数据集包含短信文本数据,用于垃圾短信检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了收集这些短信的时间段。...
    packageimg
  • 垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11

    2025年4月26日   

    垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源:互联网公开数据 标签:垃圾邮件,短信,自然语言处理,文本分类,机器学习,数据集,情感分析,信息安全 数据概述: 该数据集包含来自公开渠道的短信数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了收集数据的时期。...
    packageimg
  • 轻量级有毒评论数据集ToxicLiteDataset-justinluu

    2025年4月26日   

    轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源:互联网公开数据 标签:文本分析,自然语言处理,情感分析,数据集,机器学习,有毒评论,社交媒体,文本分类 数据概述: 该数据集包含来自社交媒体平台(如Twitter,Reddit等)的评论数据,记录了评论的文本内容及其有毒性标签。主要特征如下:...
    packageimg
  • 情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri

    2025年4月26日   

    情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,BERT模型,机器学习,文本分类,深度学习,人工智能 数据概述: 该数据集专注于情感分析任务,基于BERT-...
    packageimg
  • GermEval18文本分类数据集-thedevastator

    2025年4月22日   

    GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:...
    packageimg
  • 泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad

    2025年4月26日   

    泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源:互联网公开数据 标签:泰迪QA,多语言问答,数据集,自然语言处理,机器学习,文本分类,语言理解,计算机辅助翻译 数据概述: 该数据集包含来自泰迪QA(TYDI...
    packageimg
  • 网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos

    2025年4月26日   

    网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos 数据来源:互联网公开数据 标签:网络欺凌,文本分类,自然语言处理,情感分析,社交媒体,机器学习,欺凌检测,文本数据 数据概述:...
    packageimg