-
乍得文本仇恨言论检测数据集-msas88
乍得文本仇恨言论检测数据集-msas88 数据来源:互联网公开数据 标签:仇恨言论,文本分析,自然语言处理,机器学习,乍得,法语,阿拉伯语,社交媒体 数据概述: 该数据集包含来自乍得社交媒体平台的文本数据,用于仇恨言论检测任务。主要特征如下: 时间跨度:数据记录的时间范围未知。 地理范围:数据主要来源于乍得地区的社交媒体平台。...
-
arXiv论文摘要及分类数据集DF-arXivResampledDataset-martabrasola
arXiv论文摘要及分类数据集DF-arXivResampledDataset-martabrasola 数据来源:互联网公开数据 标签:学术论文,数据集,文本分析,机器学习,自然语言处理,论文分类,arXiv,深度学习 数据概述:...
-
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308
Jigsaw文本分类数据集JigsawTextClassificationDataset-muskaansharma1308 数据来源:互联网公开数据 标签:文本分类,数据集,自然语言处理,机器学习,情感分析,数据挖掘,多语言,文本标注 数据概述:...
-
垃圾邮件数据集SpamDataSet-vhenrique21
垃圾邮件数据集SpamDataSet-vhenrique21 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,机器学习,文本分析,自然语言处理,数据挖掘,信息安全 数据概述: 该数据集包含来自电子邮件平台的邮件数据,记录了邮件的分类信息,主要用于垃圾邮件识别研究。主要特征如下: 时间跨度:数据记录的时间范围从2000年到2020年。...
-
乌克兰新闻文章分类数据集UkrainianNewsArticlesbyCategoriesDataset-andriibilinskiy
乌克兰新闻文章分类数据集UkrainianNewsArticlesbyCategoriesDataset-andriibilinskiy 数据来源:互联网公开数据 标签:新闻文章,数据集,文本分析,自然语言处理,分类,乌克兰,时事,媒体研究 数据概述: 该数据集包含来自乌克兰不同来源的新闻文章,根据内容进行分类。主要特征如下: 时间跨度:...
-
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc
马拉地语处理数据集MarathiProcessedDataset-11Oct-parthplc 数据来源:互联网公开数据 标签:语言处理,马拉地语,自然语言处理,数据集,文本分析,机器学习,语言翻译,数据挖掘 数据概述: 该数据集包含经过处理的马拉地语文本数据,记录了马拉地语的自然语言文本信息。主要特征如下:...
-
印度电商平台Flipkart商品评论情感分析数据集FlipkartReviewsSentimentAnalysisDataset-subho117
印度电商平台Flipkart商品评论情感分析数据集FlipkartReviewsSentimentAnalysisDataset-subho117 数据来源:互联网公开数据 标签:电商,评论分析,情感分析,自然语言处理,机器学习,文本挖掘,印度,Flipkart 数据概述:...
-
情感分类数据集EmotionClassifierDataset-shauryavardhan1
情感分类数据集EmotionClassifierDataset-shauryavardhan1 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,情感识别,数据挖掘,人工智能 数据概述: 该数据集包含来自互联网公开渠道的情感分类数据,记录了文本内容的情感倾向。主要特征如下: 时间跨度:数据记录的时间范围为近五年。...
-
多类别情感分析数据集-sarath02003
多类别情感分析数据集-sarath02003 数据来源:互联网公开数据 标签:情感分析,文本分类,机器学习,自然语言处理,情感识别,数据集,NLP,情绪分析 数据概述: 该数据集包含了用于多类别情感分析的文本数据。主要特征如下: 时间跨度:数据涵盖了不同时间段的文本。 地理范围:数据来源多样,不局限于特定地区。...
-
文本情感分析数据集TextSentimentAnalysisDatasetV2-ahmedeabozaid
文本情感分析数据集TextSentimentAnalysisDatasetV2-ahmedeabozaid 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,大数据,人工智能,数据挖掘 数据概述: 该数据集包含来自互联网公开数据的文本情感分析数据,记录了不同文本内容所表达的情感倾向。主要特征如下:...
-
垃圾邮件与非垃圾邮件数据集SpamorNotSpamDataset-ahmedze1n
垃圾邮件与非垃圾邮件数据集SpamorNotSpamDataset-ahmedze1n 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件识别,数据集,机器学习,文本分析,自然语言处理,信息分类,网络安全 数据概述: 该数据集包含来自电子邮件服务的邮件数据,记录了邮件是否为垃圾邮件的标识。主要特征如下:...
-
情绪平衡数据集BalancedEmotionDataset-rahulshelke98
情绪平衡数据集BalancedEmotionDataset-rahulshelke98 数据来源:互联网公开数据 标签:情绪分析,数据集,自然语言处理,情感识别,机器学习,心理学,文本分析,人工智能 数据概述: 该数据集包含来自多个来源的情感标注文本数据,旨在平衡不同情绪类别之间的样本数量,适用于情绪分析,情感识别等任务。主要特征如下:...
-
笑话内容分类数据集JokesDataset-yaroslav62
笑话内容分类数据集JokesDataset-yaroslav62 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,幽默分析,机器学习,情感分析,娱乐内容,语言模型 数据概述: 该数据集包含来自互联网的笑话内容数据,记录了各类笑话的文本信息及其相关分类标签。主要特征如下:...
-
性别偏见分析数据集GenderBiasAnalysisDataset-manvideore
性别偏见分析数据集GenderBiasAnalysisDataset-manvideore 数据来源:互联网公开数据 标签:性别偏见,数据集,自然语言处理,文本分析,机器学习,社会科学,情感分析,偏见检测 数据概述: 该数据集包含用于分析和研究文本数据中性别偏见的各种信息。主要特征如下:...
-
垃圾邮件识别数据集SpamMailDataset-anandpanda3
垃圾邮件识别数据集SpamMailDataset-anandpanda3 数据来源:互联网公开数据 标签:垃圾邮件,数据集,文本分类,自然语言处理,机器学习,邮件过滤,信息安全,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于训练和评估垃圾邮件识别模型。主要特征如下: 时间跨度:数据记录的时间范围未明确,但涵盖了邮件的历史数据。...
-
推特性别歧视检测数据集TwitterSexismDetectionDataset-giseledacosta
推特性别歧视检测数据集TwitterSexismDetectionDataset-giseledacosta 数据来源:互联网公开数据 标签:社交媒体,性别歧视,自然语言处理,文本分类,数据集,情感分析,机器学习,社会学 数据概述: 该数据集包含来自推特(Twitter)平台的推文数据,用于研究和检测性别歧视言论。主要特征如下:...
-
有害言论检测数据集ToxicSemEvalData-izuna385
有害言论检测数据集ToxicSemEvalData-izuna385 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,情感分析,机器学习,有害内容检测,社交媒体,文本分析 数据概述: 该数据集包含来自 SemEval 2017 竞赛的数据,主要用于有害言论的检测与分类。主要特征如下: 时间跨度:数据记录的时间范围为 SemEval...
-
虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant
虚假新闻检测数据集FakeNewsCCDataset-rahilmerchant 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息,自然语言处理,机器学习,文本分类,信息传播,网络安全 数据概述: 该数据集包含来自互联网的新闻文章数据,记录了新闻的真实性分类信息。主要特征如下: 时间跨度:数据记录的时间范围从2016年到2019年。...
-
在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal
在线文章标题与标题党标签数据集OnlineArticleTitlewithClickbaitLabelDataset-bantalmetal 数据来源:互联网公开数据 标签:文本分析,数据集,自然语言处理,标题党,机器学习,内容推荐,传播学,信息处理 数据概述:...
-
对话意图分类数据集-anandnakat
对话意图分类数据集-anandnakat 数据来源:互联网公开数据 标签:自然语言处理,对话系统,意图识别,数据集,机器学习,文本分类,人工智能,对话分析 数据概述: 该数据集包含用于对话意图分类的文本数据,记录了用户在对话中的各种表达方式及其对应的意图类别。主要特征如下: 时间跨度:数据记录的时间范围不限,持续更新。...



