找到3,950个数据集

标签: 文本分类

过滤结果
  • 数据10000条样本语言识别数据集-amitverma2030

    2025年4月23日   

    10000条样本语言识别数据集-amitverma2030 数据来源:互联网公开数据 标签:语言识别,数据集,自然语言处理,文本分类,机器学习,文本分析,语言学,人工智能 数据概述: 该数据集包含10000条文本样本,用于语言识别任务。主要特征如下: 时间跨度:数据无明确的时间范围,为静态数据集。 地理范围:数据涵盖多种语言,文本来源多样。...
    packageimg
  • 网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe

    2025年4月23日   

    网络评论情绪识别与毒性分析数据集JigsawRudeCommentsDataset-gonnbe 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本分类,机器学习,社交网络,内容审核,有害言论 数据概述: 该数据集来源于Jigsaw组织提供的网络评论数据,记录了互联网平台上的用户评论,并标注了评论的情绪和毒性程度。主要特征如下:...
    packageimg
  • 阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr

    2025年4月23日   

    阿拉伯语文本分类数据集ArabicTextClassificationDataset-mustafahowr 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,语言模型,机器翻译,阿拉伯语 数据概述: 该数据集包含阿拉伯语文本数据,记录了不同主题和类别的阿拉伯语文章,评论或文档。主要特征如下:...
    packageimg
  • 挪威语评论情感分析数据集-文本情感分类-2024-ravaghi

    2025年4月23日   

    挪威语评论情感分析数据集-文本情感分类-2024-ravaghi 数据来源:互联网公开数据 标签:情感分析,文本分类,挪威语,自然语言处理,机器学习,评论,NoReC,情感极性 数据概述:...
    packageimg
  • 垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar

    2025年4月23日   

    垃圾评论检测数据集SpamCommentsDataset-arslanabdulghaffar 数据来源:互联网公开数据 标签:垃圾评论,数据集,文本分类,自然语言处理,机器学习,恶意内容检测,社交媒体,内容审核 数据概述: 该数据集包含来自社交媒体平台的评论数据,用于训练和评估垃圾评论检测模型。主要特征如下:...
    packageimg
  • 诗歌-议论文及散文文本数据集-huosiyuan

    2025年4月23日   

    诗歌-议论文及散文文本数据集-huosiyuan 数据来源:互联网公开数据 标签:诗歌,议论文,散文,文本分析,自然语言处理,写作风格,文本分类,教育 数据概述:...
    packageimg
  • 虚假招聘信息识别数据集-招聘信息文本与元数据-通用-whenamancodes

    2025年4月23日   

    虚假招聘信息识别数据集-招聘信息文本与元数据-通用-whenamancodes 数据来源:互联网公开数据 标签:招聘,虚假招聘,欺诈,文本分类,自然语言处理,机器学习,就业,数据分析 数据概述:...
    packageimg
  • 情感分析测试数据集WASSATestAngerFilteredDataset-marouanesidali

    2025年4月23日   

    情感分析测试数据集WASSATestAngerFilteredDataset-marouanesidali 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,心理学,人工智能 数据概述: 该数据集来源于WASSA情感分析挑战赛,专注于愤怒情感的识别。主要特征如下:...
    packageimg
  • 自然语言处理多分类任务BERTBase越南语数据集NLPMulticlassBERTBaseVietnameseDataset-aeryss

    2025年4月23日   

    自然语言处理多分类任务BERTBase越南语数据集NLPMulticlassBERTBaseVietnameseDataset-aeryss 数据来源:互联网公开数据 标签:自然语言处理,多分类任务,BERT模型,越南语,数据集,机器学习,文本分类,人工智能 数据概述:...
    packageimg
  • 麦比乌斯鲸鱼小说文本数据集MobyDickTextDataset-mmmarchetti

    2025年4月23日   

    麦比乌斯鲸鱼小说文本数据集MobyDickTextDataset-mmmarchetti 数据来源:互联网公开数据 标签:文学分析,文本挖掘,自然语言处理,数据集,机器学习,文本分类,小说研究,英语文学 数据概述: 该数据集包含来自赫尔曼·梅尔维尔经典小说《白鲸》(Moby Dick)的完整文本数据,记录了小说的全文内容及其相关章节信息。主要特征如下:...
    packageimg
  • 股票价格与情绪分类数据集-ahmedashrafahmed

    2025年4月23日   

    股票价格与情绪分类数据集-ahmedashrafahmed 数据来源:互联网公开数据 标签:股票价格,情绪分析,数据集,金融,自然语言处理,机器学习,文本分类,市场预测 数据概述: 该数据集包含股票价格数据和相关的情绪分析结果,用于股票价格预测与市场情绪研究。主要特征如下: 时间跨度:数据记录的时间范围从2010年至今。...
    packageimg
  • 情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni

    2025年4月23日   

    情感分析情感识别数据集FEEL-ITDatasetPreliminaryResults-darioceni 数据来源:互联网公开数据 标签:情感分析,情感识别,数据集,自然语言处理,机器学习,文本分类,情感计算,数据挖掘 数据概述: 该数据集包含来自FEEL-IT项目的初步研究结果,记录了文本数据的情感识别信息。主要特征如下:...
    packageimg
  • 现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong

    2025年4月22日   

    现代BERT模型微调数据集Fine-tuneModernBERTDataset-nlgluong 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,BERT,模型微调,情感分析,文本分类 数据概述: 该数据集包含用于微调现代BERT模型的数据,主要记录了用于各种自然语言处理任务的文本信息。主要特征如下:...
    packageimg
  • 虚假与真实新闻数据集FakeandTrueNewsDatasets-ramaqubra

    2025年4月22日   

    虚假与真实新闻数据集FakeandTrueNewsDatasets-ramaqubra 数据来源:互联网公开数据 标签:新闻分析,数据集,文本分类,机器学习,信息传播,自然语言处理,虚假信息,新闻媒体 数据概述: 该数据集包含来自多个新闻来源的文本数据,记录了虚假新闻与真实新闻的内容对比。主要特征如下:...
    packageimg
  • 情绪识别LSTM数据集EmotionDetectionLSTMDataset-annadad

    2025年4月22日   

    情绪识别LSTM数据集EmotionDetectionLSTMDataset-annadad 数据来源:互联网公开数据 标签:情绪识别,数据集,深度学习,自然语言处理,情感分析,机器学习,文本分类,人工智能 数据概述:...
    packageimg
  • 数据4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873

    2025年4月22日   

    4KMixtral87B生成文本与AI检测数据集4KMixtral87BCraftedEssaysforDetectAICompDataset-jisukim8873 数据来源:互联网公开数据 标签:自然语言处理,文本生成,AI检测,机器学习,数据集,文本分类,深度学习,学术研究 数据概述: 该数据集包含由Mixtral...
    packageimg
  • 预训练RoBERTa-base模型预测结果数据集-mathislucka

    2025年4月22日   

    预训练RoBERTa-base模型预测结果数据集-mathislucka 数据来源:互联网公开数据 标签:自然语言处理,文本分析,情感分析,机器翻译,文本分类,模型预测,RoBERTa,数据集 数据概述: 该数据集包含了基于预训练RoBERTa-base模型对文本数据的预测结果。主要特征如下:...
    packageimg
  • 多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073

    2025年4月22日   

    多语言仇恨言论检测数据集MultilingualHateSpeechDetectionDataset-fida5073 数据来源:互联网公开数据 标签:仇恨言论,多语言,自然语言处理,文本分类,机器学习,情感分析,社交媒体,数据集 数据概述: 该数据集包含来自社交媒体平台的多语言文本数据,旨在用于仇恨言论的检测和分类。主要特征如下:...
    packageimg
  • 虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka

    2025年4月22日   

    虚假新闻文本识别数据集FakedditText50kDataset-rajatdhanuka 数据来源:互联网公开数据 标签:虚假新闻,文本识别,数据集,自然语言处理,机器学习,情感分析,信息传播,文本分类 数据概述: 该数据集包含来自Fakeddit项目的文本数据,记录了50,000条新闻文本及其真实性标签。主要特征如下:...
    packageimg
  • 推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod

    2025年4月22日   

    推特训练数据集TwitterTrainingDataCSVDataset-compellingdemigod 数据来源:互联网公开数据 标签:社交媒体,文本分析,数据集,机器学习,情感分析,自然语言处理,数据挖掘,文本分类 数据概述: 该数据集包含来自推特平台的公开文本数据,记录了用户发布的推文及其相关信息。主要特征如下:...
    packageimg