-
多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56
多类别邮件分类数据集MulticlassEmailClassificationDataset-kevinzb56 数据来源:互联网公开数据 标签:邮件分类,数据集,文本分析,机器学习,自然语言处理,信息分类,电子邮件,数据分析 数据概述: 该数据集包含来自多个来源的电子邮件数据,记录了不同类别的邮件内容。主要特征如下:... -
项目文件数据集-justingrima
项目文件数据集-justingrima 数据来源:互联网公开数据 标签:项目管理,文件分析,数据集,文档处理,数据挖掘,文本分析,信息检索,版本控制 数据概述: 该数据集包含了一系列项目文件的相关数据,记录了项目中各种类型文件的详细信息。主要特征如下: 时间跨度:数据记录的时间范围涵盖了项目文件的创建,修改和版本控制时间。... -
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar
中越双语平行语料数据集Chinese-VietnameseParallelCorpusDataset-flightstar 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,翻译研究,双语资源,文本分析,语言技术,人工智能 数据概述: 该数据集包含来自中越双语平行语料库的数据,记录了中越两种语言的对应文本。主要特征如下:... -
Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp
Reddit热门帖子标题数据集TopHotRedditPostTitlesDataset-tylorp 数据来源:互联网公开数据 标签:社交媒体,数据集,文本分析,情感分析,机器学习,自然语言处理,网络文化,内容挖掘 数据概述: 该数据集包含来自Reddit平台的热门帖子标题数据,记录了平台上备受关注的帖子的标题信息。主要特征如下:... -
垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819
垃圾短信语音识别结果数据集SpamPhonemeResultsDataset-infinity9819 数据来源:互联网公开数据 标签:垃圾短信,语音识别,数据集,机器学习,文本分析,自然语言处理,通信,反垃圾 数据概述: 该数据集包含了垃圾短信的语音识别结果,记录了通过语音识别技术转换后的垃圾短信文本数据。主要特征如下:... -
情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert
情感分析评论数据集SentimentAnalysisReviewDataset-ankitgilbert 数据来源:互联网公开数据 标签:情感分析,评论数据,数据集,自然语言处理,机器学习,文本分析,市场研究,用户体验 数据概述: 该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品,服务或内容的情感表达。主要特征如下:... -
多语言标记数据集MultilangTokensDataset-pranav51286
多语言标记数据集MultilangTokensDataset-pranav51286 数据来源:互联网公开数据 标签:自然语言处理,数据集,多语言,文本分析,词汇分析,机器翻译,语言学,深度学习 数据概述: 该数据集包含多种语言的文本数据,用于自然语言处理任务,特别是多语言文本分析和模型训练。主要特征如下:... -
金苹果VK和Telegram平台用户互动数据分析数据集-2024年6月12日-evgeny1928
金苹果VK和Telegram平台用户互动数据分析数据集-2024年6月12日-evgeny1928 数据来源:互联网公开数据 标签:社交媒体,用户互动,内容分析,VK,Telegram,金苹果,帖子,互动数据,文本分析 数据概述:... -
电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi
电影情感分析数据集MovieSentimentAnalysisDataset-naufalalfarisi 数据来源:互联网公开数据 标签:电影,情感分析,数据集,自然语言处理,机器学习,文本分析,评论,社交媒体 数据概述:该数据集包含来自多个电影评论网站的用户评论,记录了对电影的情感评价。主要特征如下:... -
网页链接与描述数据集-fan1dy
网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。... -
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni
文本可读性训练特征数据集ReadabilityTrainFeaturesDataset-akgeni 数据来源:互联网公开数据 标签:文本可读性,数据集,自然语言处理,机器学习,教育,阅读理解,文本分析,语言学... -
亚马逊草本茶产品评论数据集-unwrangle
亚马逊草本茶产品评论数据集-unwrangle 数据来源:互联网公开数据 标签:亚马逊,草本茶,产品评论,消费者反馈,文本分析,情感分析,市场调研,电商数据 数据概述:... -
推特灾难文本分析数据集-bharathsj
推特灾难文本分析数据集-bharathsj 数据来源:互联网公开数据 标签:推特数据,灾难事件,文本分析,自然语言处理,情感分析,信息提取,机器学习,社会科学 数据概述: 该数据集包含来自推特(Twitter)的文本数据,记录了与灾难事件相关的推文内容。主要特征如下: 时间跨度: 数据记录的时间范围根据数据集具体情况而定,通常涵盖特定灾难事件发生前后。... -
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika
BBC新闻导航数据集BBCNewsNavigatorDataset-remyakarthika 数据来源:互联网公开数据 标签:新闻媒体,数据集,文本分析,自然语言处理,信息检索,机器学习,新闻分类,数据分析 数据概述:该数据集包含来自BBC新闻导航系统的数据,记录了新闻文章的详细信息。主要特征如下:... -
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy
沃森翻译文本对比数据集ContradictoryMyWatsonTranslatedDataset-pradeepmuniasamy 数据来源:互联网公开数据 标签:机器翻译,文本对比,数据集,自然语言处理,深度学习,文本分析,翻译质量,语言学 数据概述: 该数据集包含由IBM... -
垃圾邮件识别数据集SpamEmailDataDataset-ukveteran
垃圾邮件识别数据集SpamEmailDataDataset-ukveteran 数据来源:互联网公开数据 标签:邮件分类,垃圾邮件,数据集,机器学习,自然语言处理,文本分析,网络安全,数据挖掘 数据概述: 该数据集包含来自互联网公开来源的电子邮件数据,记录了邮件的文本内容和标签(是否为垃圾邮件)。主要特征如下:... -
机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup
机器学习与数据科学领域文章摘要及链接数据集-Medium-AnalyticsVidhya-TowardsDataScience-pratirup 数据来源:互联网公开数据 标签:机器学习,数据科学,文章,博客,Medium,Analytics Vidhya,Towards Data Science,自然语言处理,深度学习,人工智能,数据挖掘,文本分析... -
仇恨言论分类数据集HateClassificationDataset-tushar877
仇恨言论分类数据集HateClassificationDataset-tushar877 数据来源:互联网公开数据 标签:文本分析,仇恨言论,数据集,情感分析,机器学习,自然语言处理,社会研究,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了各类言论及其是否属于仇恨言论的标签。主要特征如下:... -
情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75
情绪检测社交媒体数据集ToneDetectionSocialMediaDataset-zeeshanshaik75 数据来源:互联网公开数据 标签:情绪分析,数据集,社交媒体,自然语言处理,机器学习,文本分析,情绪识别,情感计算 数据概述: 该数据集包含来自社交媒体平台的数据,记录了用户发布的内容及其对应的情绪标签。主要特征如下:... -
印度COVID-19疫情新闻头条数据集-2020年3月3日至2020年4月11日-hkapoor
印度COVID-19疫情新闻头条数据集-2020年3月3日至2020年4月11日-hkapoor 数据来源:互联网公开数据 标签:COVID-19, 新闻头条, 印度, 疫情, NLP, 文本分析, 疫情影响, Inshorts 数据概述:...