找到3,868个数据集

标签: 文本分类

过滤结果
  • 罗马新闻文本数据集News-RomanDataset-zeshanali

    2025年4月25日   

    罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源:互联网公开数据 标签:新闻文本,自然语言处理,文本分析,情感分析,信息检索,文本分类,机器学习,意大利语 数据概述: 该数据集包含来自罗马地区新闻网站的文本数据,记录了各类新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 波斯语数据集PersianDataset-amirali10281

    2025年4月25日   

    波斯语数据集PersianDataset-amirali10281 数据来源:互联网公开数据 标签:波斯语,语言学,自然语言处理,数据集,文本分析,机器翻译,文本分类,语音识别 数据概述: 该数据集包含波斯语文本和相关数据,旨在为波斯语语言处理研究提供支持。主要特征如下: 时间跨度:数据记录的时间跨度不固定,涵盖了不同时期和类型的波斯语文本。...
    packageimg
  • 虚假新闻检测数据集DetectingFakeNewsDataset-mohsinchaudhary

    2025年4月25日   

    虚假新闻检测数据集DetectingFakeNewsDataset-mohsinchaudhary 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,机器学习,自然语言处理,文本分类,信息传播,社会研究 数据概述: 该数据集包含来自多个新闻来源的文本数据,记录了真实新闻和虚假新闻的文本内容及其相关信息。主要特征如下:...
    packageimg
  • 新闻CSV数据集

    2025年4月25日   

    新闻CSV数据集 数据来源:互联网公开数据 标签:新闻,CSV,文本分类,数据分析,信息处理,新闻标题,新闻正文,主题标签 数据概述:...
    packageimg
  • 虚假新闻西班牙语数据集FalseNewsinSpanishDataset-arseniitretiakov

    2025年4月25日   

    虚假新闻西班牙语数据集FalseNewsinSpanishDataset-arseniitretiakov 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,数据集,自然语言处理,机器学习,文本分类,西班牙语,信息传播 数据概述: 该数据集包含来自西班牙语媒体的虚假新闻数据,记录了各类虚假新闻的文本内容和相关特征。主要特征如下:...
    packageimg
  • 数据2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset...

    2025年4月25日   

    2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset-jeanswiegers 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,文本分类,机器学习,自然语言处理,情感识别,数据挖掘 数据概述: 该数据集源自2015年爱数据科学挑战赛(EDSA...
    packageimg
  • 印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007

    2025年4月25日   

    印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007 数据来源:互联网公开数据 标签:情感分析,自然语言处理,印地语,数据集,文本分类,机器学习,语言技术,数据分析 数据概述:...
    packageimg
  • 情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli

    2025年4月25日   

    情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本分类,机器学习,情感识别,深度学习,社交媒体 数据概述: 该数据集包含预处理后的GoEmotions数据集,用于情感分析任务。主要特征如下:...
    packageimg
  • 垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems

    2025年4月25日   

    垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems 数据来源:互联网公开数据 标签:垃圾邮件,数据集,机器学习,文本分类,自然语言处理,电子邮件,数据分析,信息安全 数据概述: 该数据集包含用于垃圾邮件检测的训练数据,记录了电子邮件的分类标签和内容信息。主要特征如下:...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-nikunjphutela

    2025年4月25日   

    自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,深度学习,语言模型,数据集,文本分类,情感分析 数据概述: 该数据集为自然语言处理项目专用,记录了多种文本数据及相关标注信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。...
    packageimg
  • 阿拉伯语文本情感分析数据集-akshat18

    2025年4月25日   

    阿拉伯语文本情感分析数据集-akshat18 数据来源:互联网公开数据 标签:自然语言处理,情感分析,阿拉伯语,文本数据,机器学习,语言学,舆情分析,文本分类 数据概述: 该数据集包含了大量的阿拉伯语文本,并标注了相应的情感极性。主要特征如下: 时间跨度: 数据未明确时间跨度,但数据内容反映了当前社会和文化背景。 地理范围:...
    packageimg
  • 超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan

    2025年4月25日   

    超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan 数据来源:互联网公开数据 标签:自然语言处理,预训练模型,机器学习,深度学习,文本分类,语言模型,人工智能,数据集 数据概述: 该数据集包含来自超大规模预训练语言模型 HS-XLNet 的数据,记录了大规模文本语料的预训练过程和结果。主要特征如下:...
    packageimg
  • 情感分析数据集SentimentAnalysisDataset-jauharazka

    2025年4月25日   

    情感分析数据集SentimentAnalysisDataset-jauharazka 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本分类,机器学习,情感挖掘,数据挖掘,人工智能 数据概述: 该数据集包含来自公开来源的文本数据,记录了不同场景下的文本及其对应的情感标签。主要特征如下:...
    packageimg
  • 性别识别数据集GenderIdentificationDataset-srimadhumithak

    2025年4月25日   

    性别识别数据集GenderIdentificationDataset-srimadhumithak 数据来源:互联网公开数据 标签:性别识别,数据集,机器学习,自然语言处理,社会研究,数据分析,人工智能,文本分类 数据概述: 该数据集包含来自互联网的公开数据,记录了用于性别识别的文本数据。主要特征如下:...
    packageimg
  • 阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi

    2025年4月25日   

    阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi 数据来源:互联网公开数据 标签:情感分析,阿拉伯语,数据集,自然语言处理,文本分类,机器学习,语言处理,情感计算 数据概述: 该数据集包含来自阿拉伯语社交媒体平台和评论网站的情感分析数据,记录了用户对特定主题或产品的情感表达。主要特征如下:...
    packageimg
  • 简历文本分类数据集ResumeTextClassificationDataset-blackitten13

    2025年4月25日   

    简历文本分类数据集ResumeTextClassificationDataset-blackitten13 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,简历分析,机器学习,招聘,人力资源,职业发展 数据概述:该数据集包含来自公开的简历文本数据,记录了不同行业和职位的个人简历信息。主要特征如下:...
    packageimg
  • 越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph

    2025年4月25日   

    越南语作文类别多标签分类数据集VietnameseEssayCategoriesMultilabelClassificationDataset-trnthinph 数据来源:互联网公开数据 标签:自然语言处理,文本分类,多标签分类,越南语,作文分析,机器学习,教育技术,语言研究 数据概述:...
    packageimg
  • 推文分类训练数据集TweetClassificationTrainingDataset-abhishek

    2025年4月25日   

    推文分类训练数据集TweetClassificationTrainingDataset-abhishek 数据来源:互联网公开数据 标签:社交媒体,文本分类,数据集,机器学习,自然语言处理,情感分析,情感识别,数据挖掘 数据概述:该数据集包含来自社交媒体平台(如Twitter)的推文数据,记录了用户发布的文本内容及其分类标签。主要特征如下:...
    packageimg
  • 推特文本情感分析训练与提交数据集-anandvatkar

    2025年4月25日   

    推特文本情感分析训练与提交数据集-anandvatkar 数据来源:互联网公开数据 标签:推特数据,情感分析,机器学习,自然语言处理,文本分类,社交媒体,数据集,人工智能 数据概述: 该数据集包含了推特(Twitter)上的文本数据,用于情感分析模型的训练和提交。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于推特数据的收集时间。...
    packageimg
  • 路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9

    2025年4月25日   

    路透社新闻文章分类数据集Reuters-21578ArticleClassificationDataset-mateuszkrasinski9 数据来源:互联网公开数据 标签:新闻文本,文本分类,机器学习,自然语言处理,数据集,信息检索,语料库,路透社 数据概述: 该数据集包含来自路透社的新闻文章,主要用于文本分类任务。主要特征如下:...
    packageimg