-
垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007
垃圾邮件分类数据集SpamMailsClassificationDataset-pg1007 数据来源:互联网公开数据 标签:垃圾邮件,邮件分类,数据集,文本分析,自然语言处理,机器学习,信息检索,文本挖掘 数据概述: 该数据集包含大量的电子邮件数据,用于垃圾邮件的识别和分类。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含不同时期的电子邮件。... -
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-mar...
Wassa2011-2016社交媒体文本数据集EkphrasisWassaData-SocialMediaTextDataset2011-2016-marouanesidali 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,数据集,情感识别,语言学,机器学习 数据概述:... -
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14
社交媒体隐含仇恨言论检测数据集ImplicitHateSpeechDetectiononSocialMediaDataset-devayani14 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,文本分析,自然语言处理,机器学习,情感分析,数据挖掘,语言学 数据概述:... -
日本新干线旅行体验数据集-balaji1989
日本新干线旅行体验数据集-balaji1989 数据来源:互联网公开数据 标签:交通运输,旅行体验,数据集,用户评价,文本分析,情感分析,机器学习,日本 数据概述: 该数据集包含了关于日本新干线旅行体验的文本数据,记录了用户对新干线旅行的各种评价和反馈。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了用户发布评价的时间段。 地理范围:... -
Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval
Jigsaw毒性严重度评估数据集JigsawToxicSeverityRatingDataset-kryval 数据来源:互联网公开数据 标签:毒性检测,文本分析,自然语言处理,情感分析,数据集,机器学习,深度学习,社会科学 数据概述: 该数据集由 Jigsaw 组织提供,旨在促进对在线评论中毒性言论严重程度的评估。主要特征如下:... -
印地语语法学习数据集-donutkashvi
印地语语法学习数据集-donutkashvi 数据来源:互联网公开数据 标签:印地语,语法,语言学,数据集,自然语言处理,文本分析,教育,机器学习 数据概述: 该数据集包含印地语语法学习相关的数据,旨在为印地语学习者和语言学研究人员提供资源。主要特征如下: 时间跨度:数据收集时间跨度不定,涵盖了印地语的多种语法现象。... -
自然语言处理灾难推文分类数据集NLPDisasterTweetClassificationDataset-nareshkumarmarrapu
自然语言处理灾难推文分类数据集NLPDisasterTweetClassificationDataset-nareshkumarmarrapu 数据来源:互联网公开数据 标签:自然语言处理,推文,灾难,分类,文本分析,机器学习,社交媒体,应急管理 数据概述: 该数据集包含了从Twitter上收集的推文数据,旨在用于灾难事件相关的推文分类。主要特征如下:... -
鬼灭之刃动画剧集脚本数据集-jaytimber
鬼灭之刃动画剧集脚本数据集-jaytimber 数据来源:互联网公开数据 标签:动画,剧本,动漫,鬼灭之刃,影视剧本,文本分析,文化研究,日语 数据概述: 该数据集包含鬼灭之刃动画剧集的脚本数据,记录了动画剧集中各集的内容和对话。主要特征如下: 时间跨度:数据记录的时间范围涵盖鬼灭之刃动画剧集的所有季。... -
小型语句情感分析数据集-alouloufiras
小型语句情感分析数据集-alouloufiras 数据来源:互联网公开数据 标签:情感分析,文本分析,数据集,自然语言处理,机器学习,情绪识别,NLP,中文 数据概述:该数据集包含短小的中文语句,并标注了对应的情感极性。主要特征如下: 时间跨度:数据记录的时间范围不明确,但涵盖了现代汉语的使用场景。... -
推特仇恨言论数据集TwitterHateSpeechDataset-dhruvi07
推特仇恨言论数据集TwitterHateSpeechDataset-dhruvi07 数据来源:互联网公开数据 标签:仇恨言论,推特,社交媒体,文本分析,自然语言处理,情感分析,数据集,机器学习 数据概述: 该数据集包含了来自推特(Twitter)平台的推文数据,用于仇恨言论检测和分析。主要特征如下:... -
数据2019年美国数据分析师职位分析数据集-anjolaoluwaajayi
2019年美国数据分析师职位分析数据集-anjolaoluwaajayi 数据来源:互联网公开数据 标签:数据分析,职位分析,美国,2019年,招聘信息,文本分析,自然语言处理,职业发展 数据概述:该数据集包含了2019年在美国发布的多个数据分析师职位信息。主要特征如下: 时间跨度:数据记录的时间范围为2019年全年。 地理范围:数据主要覆盖美国境内。... -
新闻文本数据集ScrapedNewsDataDataset-eilhie
新闻文本数据集ScrapedNewsDataDataset-eilhie 数据来源:互联网公开数据 标签:新闻数据,文本分析,数据集,自然语言处理,机器学习,信息提取,数据挖掘,新闻媒体 数据概述: 该数据集包含来自互联网的公开新闻数据,记录了各类新闻文本的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从【起始年份】到【结束年份】。... -
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk
问题重述与表达优化数据集RephrasingQuestionDataset-anhhne1809kk 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,语义理解,语言模型,教育技术,数据挖掘 数据概述: 该数据集包含来自多个来源的问题重述和表达优化数据,记录了不同领域问题的原始表述及其优化后的重述。主要特征如下:... -
Jigsaw评论毒性验证数据集-hmikraminfo
Jigsaw评论毒性验证数据集-hmikraminfo 数据来源:互联网公开数据 标签:自然语言处理,文本分析,毒性检测,数据集,机器学习,情感分析,评论,社交媒体 数据概述: 该数据集由 Jigsaw 团队提供,用于验证和评估文本毒性检测模型。主要特征如下: 时间跨度:数据记录的时间范围未知,但包含了大量的近期评论数据。... -
对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla
对话记录清理数据集TranscriptCleanedDataset-mariamfaroukgadalla 数据来源:互联网公开数据 标签:对话记录,文本清理,数据集,自然语言处理,机器学习,文本分析,数据预处理,语言学 数据概述:该数据集包含经过清理的对话记录,适用于自然语言处理,文本分析等任务。主要特征如下:... -
推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9
推文情感预测数据集TweetSentimentPredictionDataset-dinoooo9 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,自然语言处理,机器学习,文本分析,数据挖掘,情感识别 数据概述: 该数据集包含来自Twitter平台的推文数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:... -
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk
维基百科文章向量文件数据集WikipediaArticlesVectorFileDataset-sachinsk 数据来源:互联网公开数据 标签:维基百科,文章向量,自然语言处理,数据集,机器学习,文本分析,词嵌入,信息检索 数据概述: 该数据集包含来自维基百科的文章向量数据,记录了维基百科文章的词嵌入向量。主要特征如下: 时间跨度:... -
越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911
越南语翻译数据集VietnameseTranslateDataset-tranvannhan1911 数据来源:互联网公开数据 标签:语言学习,翻译,数据集,自然语言处理,机器学习,越南语,文本分析,语言技术 数据概述: 该数据集包含来自越南语翻译项目的数据,记录了越南语与其它语言(如英语,中文等)之间的翻译数据。主要特征如下:... -
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser
文本特征提取TF-IDF提交数据集TF-IDFSubmissionDataset-panser 数据来源:互联网公开数据 标签:文本分析,TF-IDF,数据集,自然语言处理,机器学习,信息检索,文本挖掘,文本特征 数据概述: 该数据集包含来自公开提交的文本特征提取数据,记录了通过TF-IDF方法提取的文本特征。主要特征如下:... -
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin
命名实体识别Keras输出数据集NameEntityRecognitionwithKerasOutputDataset-lonnieqin 数据来源:互联网公开数据 标签:命名实体识别, 数据集, 自然语言处理, 机器学习, Keras, 人工智能, 文本分析, 语义理解 数据概述:...