找到3,950个数据集

标签: 文本分类

过滤结果
  • 垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal

    2025年4月23日   

    垃圾邮件与非垃圾邮件分类数据集MergedSpam-HamDataset-aslantasserdal 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,分类算法,网络安全 数据概述: 该数据集包含来自多个来源的垃圾邮件和非垃圾邮件数据,记录了电子邮件的文本内容和分类标签。主要特征如下:...
    packageimg
  • 僧伽罗语新闻标题数据集-nawarathnadeshan

    2025年4月23日   

    僧伽罗语新闻标题数据集-nawarathnadeshan 数据来源:互联网公开数据 标签:新闻,文本分析,自然语言处理,僧伽罗语,文本分类,情感分析,数据集,信息检索 数据概述: 该数据集包含来自僧伽罗语新闻网站的新闻标题数据,记录了各种新闻文章的标题信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体时间范围取决于数据集的构建时间。...
    packageimg
  • 多标签文本分类数据集-bimleshkumar759

    2025年4月23日   

    多标签文本分类数据集-bimleshkumar759 数据来源:互联网公开数据 标签:文本分类,多标签,数据集,机器学习,自然语言处理,文本分析,深度学习,NLP 数据概述: 该数据集包含用于多标签文本分类任务的文本数据。主要特征如下: 时间跨度: 数据记录的时间范围不固定,取决于原始数据来源。 地理范围: 数据覆盖范围不固定,取决于原始数据来源。...
    packageimg
  • 土耳其语IMDB电影评论情感分析数据集-yusufgoktas

    2025年4月23日   

    土耳其语IMDB电影评论情感分析数据集-yusufgoktas 数据来源:互联网公开数据 标签:情感分析,土耳其语,电影评论,自然语言处理,文本分类,机器学习,NLP,土耳其 数据概述: 该数据集包含了来自互联网电影数据库(IMDB)的土耳其语电影评论数据,用于情感分析任务。主要特征如下:...
    packageimg
  • 多语言自然语言推理与跨语言推理数据集

    2025年4月23日   

    多语言自然语言推理与跨语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,跨语言推理,多语言,文本分类,模型训练,迁移学习,句子对分类 数据概述: 本数据集结合了MNLI(多领域自然语言推理)和XNLI(跨语言自然语言推理)数据集,并扩展了NLI数据,提供了一个丰富的多语言资源,适用于自然语言推理任务的研究和开发。数据集包含多个语言中的前提-...
    packageimg
  • 新闻文本分类数据集-priyabratapanda

    2025年4月23日   

    新闻文本分类数据集-priyabratapanda 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,NLP,数据集,信息检索,舆情分析 数据概述:该数据集包含来自多种新闻来源的文本数据,用于新闻文本的分类任务。主要特征如下: 时间跨度:数据记录的时间跨度为不固定,涵盖了不同时间段的新闻报道。...
    packageimg
  • 乌尔都语情感与讽刺数据集UrduSentimentandSarcasmDatasets-noorsaeed

    2025年4月23日   

    乌尔都语情感与讽刺数据集UrduSentimentandSarcasmDatasets-noorsaeed 数据来源:互联网公开数据 标签:自然语言处理,情感分析,讽刺识别,数据集,乌尔都语,文本分类,机器学习,多模态分析 数据概述: 该数据集包含来自乌尔都语社交媒体平台的文本数据,记录了用户发布的帖子及其情感和讽刺标签。主要特征如下:...
    packageimg
  • 性别检测数据集GenderDetectionDataset-subhajournal

    2025年4月23日   

    性别检测数据集GenderDetectionDataset-subhajournal 数据来源:互联网公开数据 标签:性别检测,数据集,自然语言处理,机器学习,文本分析,文本分类,社会研究,信息提取 数据概述:该数据集包含来自互联网的公开数据,记录了不同用户在社交媒体上的用户名,昵称和相关文本信息,适用于性别检测和分类任务。主要特征如下:...
    packageimg
  • 韩语仇恨言论数据集

    2025年4月23日   

    韩语仇恨言论数据集 数据来源:互联网公开数据 标签:韩语,仇恨言论,文本分类,自然语言处理,社会分析,多分类模型,二分类模型 数据概述: 本数据集包含韩语仇恨言论文本数据,由从韩国右翼网站“일간베스트”爬取的仇恨和歧视性评论组成。数据集分为两部分: 1. hate-speech-binary-...
    packageimg
  • 自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks

    2025年4月23日   

    自然语言处理微调与优化数据集Fine-tuningDatasetforNLPOptimization-inductiveanks 数据来源:互联网公开数据 标签:自然语言处理,微调,文本分类,数据集,机器学习,深度学习,语言模型,模型优化...
    packageimg
  • 葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing

    2025年4月23日   

    葡萄牙语文本分类数据集PortugueseTextClassificationDataset-rookiejing 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,语言模型,机器学习,多语言,文本分析,语言学 数据概述: 该数据集包含来自葡萄牙语互联网的文本数据,专门用于葡萄牙语的文本分类任务。主要特征如下:...
    packageimg
  • 印度政治推特情感分析数据集-2023-shashankkumarranjan

    2025年4月23日   

    印度政治推特情感分析数据集-2023-shashankkumarranjan 数据来源:互联网公开数据 标签:推特,情感分析,印度政治,社交媒体,文本分类,数据分析,公众意见 数据概述:...
    packageimg
  • 电影剧情概述与类型关联分析数据集-hetpatel01

    2025年4月23日   

    电影剧情概述与类型关联分析数据集-hetpatel01 数据来源:互联网公开数据 标签:电影,类型,剧情,文本分析,自然语言处理,NLP,文本分类,推荐系统,多标签分类 数据概述:...
    packageimg
  • 跨站脚本攻击XSS检测数据集XSSDetectionDataset-youssefhazemfarouk

    2025年4月23日   

    跨站脚本攻击XSS检测数据集XSSDetectionDataset-youssefhazemfarouk 数据来源:互联网公开数据 标签:网络安全,数据集,XSS攻击,机器学习,漏洞检测,文本分类,数据挖掘,信息安全 数据概述:...
    packageimg
  • 虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra

    2025年4月23日   

    虚假与真实新闻分类数据集FakeandTrueNewsClassificationDataset-ramaqubra 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,自然语言处理,信息传播,媒体研究,数据分析 数据概述:...
    packageimg
  • 路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek

    2025年4月23日   

    路透社新闻多标签分类数据集-新闻文本-1987年-narendrageek 数据来源:互联网公开数据 标签:新闻文本,多标签分类,文本分类,路透社,机器学习,自然语言处理,主题分类 数据概述:...
    packageimg
  • 垃圾邮件检测数据集-文本分类-2023-aiaiaidavid

    2025年4月23日   

    垃圾邮件检测数据集-文本分类-2023-aiaiaidavid 数据来源:互联网公开数据 标签:垃圾邮件检测,文本分类,机器学习,数据集,训练集,验证集,测试集 数据概述: 本数据集包含三个文件:train.csv、valid.csv 和 test.csv,用于垃圾邮件检测任务。每个文件包含两列:text 和 label。text...
    packageimg
  • 数据10K电影评论情感分析数据集-amar891

    2025年4月23日   

    10K电影评论情感分析数据集-amar891 数据来源:互联网公开数据 标签:情感分析,电影评论,自然语言处理,文本分类,机器学习,数据集,NLP,舆情分析 数据概述: 该数据集包含了10,000条电影评论数据,用于情感分析任务。主要特征如下: 时间跨度:数据的时间跨度取决于评论发布时间,但主要集中在数据集构建时期。...
    packageimg
  • 文章分类数据集ArticlesClassificationDataset-mohamedalqblawi

    2025年4月23日   

    文章分类数据集ArticlesClassificationDataset-mohamedalqblawi 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,数据分析,信息检索,内容分析,智能推荐 数据概述: 该数据集包含来自多个来源的文章数据,记录了各类文章的文本内容和分类标签。主要特征如下:...
    packageimg
  • 自然语言处理入门数据集NLPStartedDataset-liangyou

    2025年4月23日   

    自然语言处理入门数据集NLPStartedDataset-liangyou 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分析,机器学习,数据集,文本分类,情感分析,语言模型,入门 数据概述: 该数据集包含多个文本数据集,旨在帮助初学者入门自然语言处理领域。主要特征如下:...
    packageimg