-
电子邮件垃圾邮件检测数据集-salonimourya
电子邮件垃圾邮件检测数据集-salonimourya 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,自然语言处理,机器学习,信息检索,数据挖掘 数据概述: 该数据集包含电子邮件数据,用于垃圾邮件检测。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了电子邮件产生的历史数据。... -
金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058
金融新闻情感分析数据集Aspect-basedSentimentAnalysisonFinancialNewsDataset-sayanroy058 数据来源:互联网公开数据 标签:情感分析,金融新闻,数据集,自然语言处理,机器学习,文本挖掘,金融科技,文本分类 数据概述:... -
发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal
发票商品类别分类数据集ProductCategoryfromInvoiceDataset-rrishabhporwal 数据来源:互联网公开数据 标签:发票分析,商品分类,数据集,自然语言处理,机器学习,销售分析,商业智能,文本分类 数据概述: 该数据集包含来自商业交易发票的商品信息,记录了不同发票中商品的类别和相关信息。主要特征如下:... -
有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281
有限波斯语信息检索数据集LimitedPersianInformationRetrievalDataset-amirali10281 数据来源:互联网公开数据 标签:信息检索,波斯语,数据集,自然语言处理,机器学习,文本分类,多语言处理,语言技术 数据概述:... -
文本领域分类数据集-gauravduttakiit
文本领域分类数据集-gauravduttakiit 数据来源:互联网公开数据 标签:文本分类,自然语言处理,机器学习,数据集,领域识别,数据挖掘,文本分析,人工智能 数据概述: 该数据集包含用于文本领域分类的数据,记录了不同文本内容所属的领域信息。主要特征如下: 时间跨度:数据记录的时间范围不限,涵盖了不同时期的文本数据。... -
文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava
文档过滤与分类数据集FilteredDocumentsDataset-pragunsrivastava 数据来源:互联网公开数据 标签:文档处理,数据集,文本分类,自然语言处理,机器学习,信息检索,文本分析,数据挖掘 数据概述: 该数据集包含经过过滤和分类的文档数据,记录了各类文档的文本内容和分类标签。主要特征如下: 时间跨度:... -
二十新闻组文本分类数据集-thedevastator
二十新闻组文本分类数据集-thedevastator 数据来源:互联网公开数据 标签:文本分类,新闻组,机器学习,数据集,自然语言处理,文本分析 数据概述: 本数据集包含约20,000篇新闻组文档,这些文档被分为20个不同的新闻组。数据集最初由Ken... -
垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg
垃圾短信文本分类数据集Pred-SpamTextMessageClassificationDataset-terrychanorg 数据来源:互联网公开数据 标签:文本分类,垃圾短信,数据集,自然语言处理,机器学习,数据挖掘,通信安全,信息安全 数据概述:... -
社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar
社交媒体仇恨言论检测测试数据集GuteTestHateSpeechDetectionDataset-hachemsfar 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,数据集,自然语言处理,机器学习,文本分类,情感分析,网络安全 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容中是否包含仇恨言论的标注信息。主要特征如下:... -
电影评论情感分析数据集IMDBReviewsDataset-gulsendemir
电影评论情感分析数据集IMDBReviewsDataset-gulsendemir 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:该数据集包含来自IMDB(互联网电影数据库)的电影评论数据,记录了大量用户对电影的评价和情感倾向。主要特征如下:... -
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab
乌尔都语语言文本数据集Urdu-LanguageDataset-tabarkarajab 数据来源:互联网公开数据 标签:语言处理,文本分析,自然语言处理,乌尔都语,机器学习,数据集,文本分类,多语言 数据概述: 该数据集包含来自互联网公开资源的乌尔都语文本数据,记录了乌尔都语的自然语言文本内容。主要特征如下:... -
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound
自然语言处理入门数据集IntroductiontoNLPDataset-iheb404notfound 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,人工智能,语言模型,文本分类,情感分析 数据概述: 该数据集用于自然语言处理的入门学习和研究,记录了多种文本数据及相应的标注信息。主要特征如下:... -
科莱里奥斯伪标签V2数据集ColeridgePseudoLabelsV2Dataset-chienhsianghung
科莱里奥斯伪标签V2数据集ColeridgePseudoLabelsV2Dataset-chienhsianghung 数据来源:互联网公开数据 标签:自然语言处理,数据集,伪标签,机器学习,文本分类,学术论文,数据增强,智能分析 数据概述:... -
印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje
印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje 数据来源:互联网公开数据 标签:印尼期刊, 文本分类, 数据集, TF-IDF, 朴素贝叶斯, 机器学习, 自然语言处理, 学术研究... -
谣言评估数据集UpdatedRumourEvalDataset-latapangtey4
谣言评估数据集UpdatedRumourEvalDataset-latapangtey4 数据来源:互联网公开数据 标签:谣言评估,社交媒体,数据集,自然语言处理,机器学习,信息传播,社会媒体分析,文本分类 数据概述: 该数据集包含更新后的谣言评估数据,记录了社交媒体平台上关于特定事件的谣言和非谣言帖子。主要特征如下:... -
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa
图书评论与剧透检测数据集SpoilerBookReviewDataset-shreeyasapkotaa 数据来源:互联网公开数据 标签:图书评论,剧透检测,数据集,自然语言处理,文本分类,机器学习,情感分析,信息提取 数据概述: 该数据集包含来自亚马逊等平台的图书评论数据,记录了用户对图书的评论内容及其是否包含剧透的标注信息。主要特征如下:... -
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-yhhhrerr
IMDB电影评论情感分析数据集IMDBMovieReviewsSentimentAnalysisDataset-yhhhrerr 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本分类,电影评论,深度学习,人工智能... -
垃圾邮件与正常邮件分类数据集-平衡数据集
垃圾邮件与正常邮件分类数据集-平衡数据集 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,文本分类,电子邮件,自然语言处理,机器学习,数据集 数据概述:... -
情感分析数据集SentimentAnalysisDataset-qacenn
情感分析数据集SentimentAnalysisDataset-qacenn 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,数据挖掘,语言技术,人工智能 数据概述: 该数据集包含来自互联网公开来源的情感分析数据,记录了用户对产品,服务或内容的情感倾向。主要特征如下:... -
网络欺凌预测数据集BalancedCyberbullyingPredictionDataset-sanzidasiddike
网络欺凌预测数据集BalancedCyberbullyingPredictionDataset-sanzidasiddike 数据来源:互联网公开数据 标签:网络欺凌,情感分析,文本分类,机器学习,社交媒体,欺凌检测,自然语言处理,数据集 数据概述:...