-
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15
Quora问答平台问题数据集QuoraQuestionsDataset-ayushshandilya15 数据来源:互联网公开数据 标签:问答平台,自然语言处理,数据集,文本分析,机器学习,语义分析,社交媒体,信息检索 数据概述: 该数据集包含来自Quora问答平台的问题数据,记录了用户提出的各种问题及其相关信息。主要特征如下:... -
Reddit抑郁症讨论数据集RedditDepressionDiscussionDataset-cngphit
Reddit抑郁症讨论数据集RedditDepressionDiscussionDataset-cngphit 数据来源:互联网公开数据 标签:心理健康,抑郁症,数据集,社交媒体,文本分析,情感分析,机器学习,心理学 数据概述: 该数据集包含来自Reddit平台的抑郁症讨论数据,记录了用户在相关版块发布的帖子,评论及互动信息。主要特征如下:... -
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara
垃圾邮件和短信数据集SpamMailsandMessagesDataset-milindashehandilhara 数据来源:互联网公开数据 标签:垃圾邮件,短信,数据集,文本分析,机器学习,自然语言处理,信息过滤,网络安全 数据概述:该数据集包含来自多个来源的垃圾邮件和短信数据,记录了不同类型的垃圾信息。主要特征如下:... -
推特用户互动数据集TwitterUserInteractionDataset-monserratromero
推特用户互动数据集TwitterUserInteractionDataset-monserratromero 数据来源:互联网公开数据 标签:社交媒体,推特,用户互动,数据集,文本分析,情感分析,机器学习,数据挖掘 数据概述: 该数据集包含来自推特平台的用户互动数据,记录了用户之间的各种互动行为。主要特征如下:... -
亚马逊手机产品评论数据集AmazonMobilePhoneReviewsDataset-rajatagg
亚马逊手机产品评论数据集AmazonMobilePhoneReviewsDataset-rajatagg 数据来源:互联网公开数据 标签:电子商务,产品评论,数据集,消费者行为,文本分析,机器学习,情感分析,自然语言处理 数据概述: 该数据集包含来自亚马逊电商平台上的手机产品用户评论数据,记录了消费者对手机产品的评价和反馈。主要特征如下:... -
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac
学术论文摘要数据集ResearchAbstractsDataset-danielmendozac 数据来源:互联网公开数据 标签:学术研究,论文摘要,自然语言处理,文本分析,信息检索,机器学习,学术文献,文本挖掘 数据概述: 该数据集包含来自不同学术领域的论文摘要,记录了论文的研究主题,方法,结果和结论。主要特征如下:... -
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu
路透社新闻文本分类数据集Reuters-21578Dataset-shashwatnaidu 数据来源:互联网公开数据 标签:文本分类,新闻,自然语言处理,机器学习,数据集,信息检索,语料库,文本分析 数据概述: 该数据集包含来自路透社的新闻报道,主要用于文本分类任务。主要特征如下: 时间跨度:数据记录的时间范围主要集中在1987年。... -
主题平衡数据集Topic-BalancedDataset-karimamd95
主题平衡数据集Topic-BalancedDataset-karimamd95 数据来源:互联网公开数据 标签:数据集,主题分类,机器学习,平衡数据,文本分析,自然语言处理,数据分析,人工智能 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同主题的文本内容,旨在为机器学习和文本分类任务提供平衡的数据支持。主要特征如下:... -
文本相似度分析数据集前1万行CosineSimilaritiesDataset-First10kRows-prateiklohani
文本相似度分析数据集前1万行CosineSimilaritiesDataset-First10kRows-prateiklohani 数据来源:互联网公开数据 标签:文本分析,相似度,数据集,自然语言处理,机器学习,余弦相似度,数据挖掘,向量化 数据概述: 该数据集包含了文本相似度分析的结果,记录了文本对之间的余弦相似度得分。主要特征如下:... -
英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111
英国广播公司新闻文章数据集BBCNewsArticleDataset-mohamedtarek111 数据来源:互联网公开数据 标签:新闻文章,文本分析,自然语言处理,数据集,文本分类,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章数据,记录了BBC新闻网站上发布的各类新闻文章。主要特征如下:... -
小说文本分析与情感识别数据集NovelDataset-aayushiagrawall
小说文本分析与情感识别数据集NovelDataset-aayushiagrawall 数据来源:互联网公开数据 标签:文本分析,情感识别,数据集,自然语言处理,机器学习,文学研究,数据挖掘,情感分析 数据概述: 该数据集包含来自多个公开来源的小说文本数据,记录了不同类型小说的文本内容及其相关情感标签。主要特征如下:... -
越南语词义消歧与情感分析数据集SegmentedABSAVLSP2018-hailong1610
越南语词义消歧与情感分析数据集SegmentedABSAVLSP2018-hailong1610 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,词义消歧,机器学习,越南语,文本分析,人工智能 数据概述: 该数据集来自2018年越南语言与处理研讨会(VLS P 2018),专注于越南语中的词义消歧和情感分析任务。主要特征如下:... -
柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung
柯勒律治诗歌语料库数据集ColeridgeCorpusDataset-tungmphung 数据来源:互联网公开数据 标签:诗歌,语料库,自然语言处理,文本分析,文学研究,情感分析,文本挖掘,数据集 数据概述: 该数据集包含英国浪漫主义诗人塞缪尔·泰勒·柯勒律治(Samuel Taylor Coleridge)的诗歌作品。主要特征如下:... -
苹果公司组织架构Twitter推文数据集AppleOrganizationTwitterTweetsDataset-forensictest
苹果公司组织架构Twitter推文数据集AppleOrganizationTwitterTweetsDataset-forensictest 数据来源:互联网公开数据 标签:社交媒体,推文,苹果公司,组织架构,文本分析,自然语言处理,舆情分析,商业研究 数据概述:... -
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007
NepaliSpellCheckandCorrectionDataset尼泊尔语拼写检查与纠正数据集-tha077bct007 数据来源:互联网公开数据 标签:语言处理,拼写检查,数据集,自然语言处理,机器学习,纠错算法,文本分析,语言技术 数据概述:... -
学术研究论文数据集ResearchPaperDataset-harunshimanto
学术研究论文数据集ResearchPaperDataset-harunshimanto 数据来源:互联网公开数据 标签:学术研究,论文数据,数据集,文本分析,自然语言处理,机器学习,信息检索,教育研究 数据概述: 该数据集包含来自学术研究领域的论文数据,记录了学术期刊,会议和相关出版物上发表的研究论文的详细信息。主要特征如下:... -
孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee
孟加拉语问答数据集BengaliQuestionAnsweringDataset-prantikbanerjee 数据来源:互联网公开数据 标签:自然语言处理,问答系统,孟加拉语,数据集,文本分析,语言模型,机器阅读理解,人工智能 数据概述: 该数据集包含孟加拉语的问答对,旨在促进孟加拉语自然语言处理领域的研究和发展。主要特征如下:... -
新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie
新闻组体育话题数据集NewsgroupSportsTopicDataset-cosimaxie 数据来源:互联网公开数据 标签:新闻组,体育话题,文本分析,自然语言处理,机器学习,数据集,分类算法,文本分类 数据概述: 该数据集包含来自新闻组的体育话题相关文本数据,记录了新闻组中关于体育赛事,运动员,球队等内容的讨论。主要特征如下:... -
新冠疫情Twitter热门推文数据集COVID-19PopularTweetsDataset-brahimenesulusoy
新冠疫情Twitter热门推文数据集COVID-19PopularTweetsDataset-brahimenesulusoy 数据来源:互联网公开数据 标签:新冠疫情,推文,社交媒体,数据集,文本分析,自然语言处理,情感分析,舆情监测 数据概述: 该数据集包含来自 Twitter 的关于新冠疫情的推文数据,记录了用户在 Twitter... -
CREMA-D音频特征与文本情感数据集-nytgaming
CREMA-D音频特征与文本情感数据集-nytgaming 数据来源:互联网公开数据 标签:情感分析,音频特征,文本分析,多模态,数据集,机器学习,语音识别,情绪识别 数据概述: 该数据集整合了CREMA-D(Crowd-sourced Emotional Movies Actors Dataset)的音频特征和相应的文本转录及情感标签。主要特征如下:...