-
-
周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas
周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,文本挖掘,机器学习,数据科学,情感识别,文本分类 数据概述:...
-
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa
医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源:互联网公开数据 标签:医学,摘要,文本分类,自然语言处理,机器学习,医疗健康,语料库,医学文献 数据概述: 该数据集包含来自医学文献的摘要文本,用于文本分类任务。主要特征如下:...
-
通用语言理解评估数据集GLUEDataset-ankitchettri
通用语言理解评估数据集GLUEDataset-ankitchettri 数据来源:互联网公开数据 标签:自然语言处理,语言理解,数据集,机器学习,文本分类,语义分析,人工智能,深度学习 数据概述: 该数据集为通用语言理解评估(GLUE)项目提供的数据集,包含多种自然语言处理任务的数据,记录了不同语言理解任务的数据样本。主要特征如下:...
-
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298
讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源:互联网公开数据 标签:讽刺,嘲讽,情感分析,自然语言处理,文本数据,机器学习,情感识别,语言学 数据概述: 该数据集包含了标注了讽刺和嘲讽情感的文本数据,旨在用于情感分析和自然语言处理任务。主要特征如下:...
-
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu
马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu 数据来源:互联网公开数据 标签:新闻,语言分析,数据集,自然语言处理,文本分类,机器学习,印度语言,数据挖掘 数据概述: 该数据集包含来自马拉地语新闻媒体的文章,记录了马拉地语新闻的文本内容。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2018年。...
-
数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050
2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,反讽识别,机器学习,文本分类,语言学,情感计算 数据概述: 该数据集由2014年计算语言学协会(ACL)会议提供,专注于社交媒体文本中的反讽识别任务。主要特征如下:...
-
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn
文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,信息检索,文本分析,知识图谱,学术研究 数据概述: 该数据集包含来自多个来源的文章主题分类数据,记录了各类文章的主题标签和内容。主要特征如下:...
-
短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad
短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad 数据来源:互联网公开数据 标签:短信,垃圾邮件,数据集,自然语言处理,文本分类,机器学习,数据挖掘,信息安全 数据概述: 该数据集包含短信文本数据,用于垃圾短信检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了收集这些短信的时间段。...
-
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11
垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源:互联网公开数据 标签:垃圾邮件,短信,自然语言处理,文本分类,机器学习,数据集,情感分析,信息安全 数据概述: 该数据集包含来自公开渠道的短信数据,主要用于垃圾邮件检测任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了收集数据的时期。...
-
轻量级有毒评论数据集ToxicLiteDataset-justinluu
轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源:互联网公开数据 标签:文本分析,自然语言处理,情感分析,数据集,机器学习,有毒评论,社交媒体,文本分类 数据概述: 该数据集包含来自社交媒体平台(如Twitter,Reddit等)的评论数据,记录了评论的文本内容及其有毒性标签。主要特征如下:...
-
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta
自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源:互联网公开数据 标签:自然语言处理,NLP,数据集,文本分析,机器学习,模型训练,语言模型,情感分析 数据概述: 该数据集包含来自NLP领域的多样化文本数据,旨在支持各种NLP任务,如文本分类,情感分析,机器翻译等。主要特征如下:...
-
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri
情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,BERT模型,机器学习,文本分类,深度学习,人工智能 数据概述: 该数据集专注于情感分析任务,基于BERT-...
-
GermEval18文本分类数据集-thedevastator
GermEval18文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习 数据概述:...
-
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad
泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源:互联网公开数据 标签:泰迪QA,多语言问答,数据集,自然语言处理,机器学习,文本分类,语言理解,计算机辅助翻译 数据概述: 该数据集包含来自泰迪QA(TYDI...
-
网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos
网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos 数据来源:互联网公开数据 标签:网络欺凌,文本分类,自然语言处理,情感分析,社交媒体,机器学习,欺凌检测,文本数据 数据概述:...
-
虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi
虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi 数据来源:互联网公开数据 标签:新闻,虚假新闻,真实新闻,自然语言处理,文本分类,机器学习,舆情分析,信息检索 数据概述: 该数据集包含了来自不同来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
-
文本分类数据集TextClassificationDataset-quanghuyho06
文本分类数据集TextClassificationDataset-quanghuyho06 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,情感分析,主题建模,文本分析,人工智能 数据概述: 该数据集包含用于文本分类任务的多种文本数据,涵盖了不同领域和主题。主要特征如下:...
-
虚假评论检测数据集FakeReviewDetectionDataset-uselessguy
虚假评论检测数据集FakeReviewDetectionDataset-uselessguy 数据来源:互联网公开数据 标签:虚假评论,情感分析,自然语言处理,文本分类,机器学习,评论分析,欺诈检测,社交媒体 数据概述: 该数据集包含来自不同来源的评论数据,主要用于检测虚假评论。主要特征如下: 时间跨度:...
-
垃圾邮件过滤数据集-aymendernani
垃圾邮件过滤数据集-aymendernani 数据来源:互联网公开数据 标签:垃圾邮件,文本分类,自然语言处理,机器学习,邮件过滤,数据集,信息检索,人工智能 数据概述: 该数据集包含来自不同来源的邮件数据,用于垃圾邮件过滤任务。主要特征如下: 时间跨度:数据记录的时间范围不定,涵盖了不同时期的邮件数据。...



