-
葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs
葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs 数据来源:互联网公开数据 标签:旅游,评论,情感分析,葡萄牙,数据集,自然语言处理,文本挖掘,用户体验 数据概述: 该数据集包含来自葡萄牙旅游景点的用户评论数据,记录了游客对不同景点的评价和体验。主要特征如下:... -
亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21
亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源:互联网公开数据 标签:情感分析,罗马乌尔都语,数据集,自然语言处理,机器学习,文本分析,亚马逊评论,语言学 数据概述: 该数据集包含了来自亚马逊的罗马乌尔都语评论数据,用于情感分析任务。主要特征如下: 时间跨度: 数据记录时间跨度未知,但包含了亚马逊用户在一定时期内发表的评论。... -
可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit
可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源:互联网公开数据 标签:文本分析,可读性评估,数据集,自然语言处理,教育研究,机器学习,语料库,语言技术 数据概述: 该数据集包含用于可读性评估的文本数据,记录了多种不同难度级别的文本样本。主要特征如下: 时间跨度:... -
电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar
电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar 数据来源:互联网公开数据 标签:电影,数据集,推荐系统,相似度分析,自然语言处理,机器学习,娱乐分析,影视产业 数据概述: 该数据集包含来自互联网的电影数据,记录了多部受欢迎电影的详细信息及其相似度评分。主要特征如下:... -
Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang
Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang 数据来源:互联网公开数据 标签:问答配对,数据集,自然语言处理,文本相似度,机器学习,数据挖掘,信息检索,知识图谱 数据概述: 该数据集包含来自Quora问答平台的配对问题数据,记录了成对的问题及其相似性标签。主要特征如下:... -
垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs
垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs 数据来源:互联网公开数据 标签:垃圾邮件,邮件过滤,数据集,自然语言处理,文本分类,机器学习,信息检索,垃圾邮件检测 数据概述: 该数据集包含了大量标记为垃圾邮件(spam)和正常邮件(ham)的邮件数据,主要用于垃圾邮件过滤模型的训练和评估。主要特征如下:... -
电影用户评论数据集16部电影烂番茄评论数据集-jonsteve
电影用户评论数据集16部电影烂番茄评论数据集-jonsteve 数据来源:互联网公开数据 标签:电影评论,数据集,电影分析,自然语言处理,情感分析,用户反馈,电影推荐,娱乐研究 数据概述:该数据集包含来自烂番茄网站的16部电影的用户评论数据,记录了用户对这些电影的具体评价和评分。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2023年。... -
医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil
医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil 数据来源:互联网公开数据 标签:医疗对话,自然语言处理,数据集,医疗AI,临床分析,机器学习,健康咨询,对话系统 数据概述: 该数据集包含来自医疗场景的医生与患者对话记录,记录了医生与患者之间的交流内容。主要特征如下:... -
自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk
自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk 数据来源:互联网公开数据 标签:自然语言处理,大型语言模型,数据集,文本分析,机器学习,人工智能,语言模型,对比研究 数据概述:... -
YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty
YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty 数据来源:互联网公开数据 标签:视频字幕,数据集,自然语言处理,文本分析,机器学习,数据挖掘,多媒体,人工智能 数据概述: 该数据集包含来自YouTube平台的视频字幕数据,记录了视频内容的文字转录信息。主要特征如下:... -
法律领域分类数据集LegalAreasClassificationDataset-mohit3430
法律领域分类数据集LegalAreasClassificationDataset-mohit3430 数据来源:互联网公开数据 标签:法律,数据集,分类,机器学习,自然语言处理,文本分析,人工智能,法律研究 数据概述: 该数据集包含来自法律领域的文本数据,记录了不同法律领域的案例,法规和判决等信息。主要特征如下:... -
电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra
电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据集,自然语言处理,信息检索,数据挖掘 数据概述: 该数据集包含来自 UCI 机器学习数据库的电子邮件数据,用于垃圾邮件过滤研究。主要特征如下: 时间跨度:数据记录时间不明确,但可推断为收集于互联网早期。... -
深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh
深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源:互联网公开数据 标签:自然语言处理,深度学习,数据集,文本分析,机器学习,语言模型,文本分类,情感分析 数据概述:该数据集包含用于自然语言处理的深度学习模型训练和评估的数据,记录了多种文本类型和任务的数据。主要特征如下:... -
统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny
统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny 数据来源:互联网公开数据 标签:统计分析,词频计数,数据集,文本分析,自然语言处理,文本挖掘,数据科学,数据处理 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同文本的词频计数信息,适用于文本分析和词频统计等任务。主要特征如下:... -
推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147
推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147 数据来源:互联网公开数据 标签:推特,退休,数据集,社交媒体,文本分析,情感分析,自然语言处理,用户行为 数据概述: 该数据集包含推特(Twitter)上与退休相关的数据,记录了用户发布的推文信息。主要特征如下:... -
预处理与词形还原测试数据数据集-marouanesidali
预处理与词形还原测试数据数据集-marouanesidali 数据来源:互联网公开数据 标签:文本预处理,词形还原,自然语言处理,数据集,文本分析,机器学习,NLP,测试数据 数据概述: 该数据集包含了经过预处理和词形还原处理的文本数据,主要用于测试和评估文本处理算法的性能。主要特征如下:... -
IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101
IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101 数据来源:互联网公开数据 标签:电影评分,用户评论,数据集,情感分析,自然语言处理,数据挖掘,电影研究,机器学习 数据概述:... -
极端言论检测数据集ExtremismDetectionDataset-ftgroups
极端言论检测数据集ExtremismDetectionDataset-ftgroups 数据来源:互联网公开数据 标签:文本分析,极端言论,数据集,机器学习,自然语言处理,安全研究,社会研究,情感分析 数据概述: 该数据集包含来自网络平台和社交媒体的文本数据,记录了不同类型的极端言论内容。主要特征如下:... -
Pneuma基准测试数据集-luthfibalaka
Pneuma基准测试数据集-luthfibalaka 数据来源:互联网公开数据 标签:Pneuma,基准测试,自然语言处理,机器学习,文本生成,模型评估,文本分析,人工智能 数据概述:该数据集包含Pneuma项目发布的基准测试数据,用于评估自然语言处理模型的性能,特别是在文本生成和文本理解方面。主要特征如下:... -
英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba
英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba 数据来源:互联网公开数据 标签:自然语言处理,意图分类,数据集,机器学习,双语,文本分析,语言模型,机器翻译 数据概述: 该数据集记录了英语和法语文本的意图分类信息,主要用于训练和评估跨语言的意图识别模型。主要特征如下:...