数据集 - 海数据

葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs

2025年4月24日

葡萄牙旅游景点评论数据集PortuReviewsDataset-csomorbalazs 数据来源：互联网公开数据标签：旅游，评论，情感分析，葡萄牙，数据集，自然语言处理，文本挖掘，用户体验数据概述：该数据集包含来自葡萄牙旅游景点的用户评论数据，记录了游客对不同景点的评价和体验。主要特征如下：...

ZIP

亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21

2025年4月24日

亚马逊评论情感分析罗马乌尔都语数据集-vivekyadav21 数据来源：互联网公开数据标签：情感分析，罗马乌尔都语，数据集，自然语言处理，机器学习，文本分析，亚马逊评论，语言学数据概述：该数据集包含了来自亚马逊的罗马乌尔都语评论数据，用于情感分析任务。主要特征如下：时间跨度：数据记录时间跨度未知，但包含了亚马逊用户在一定时期内发表的评论。...

ZIP

可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit

2025年4月24日

可读性评估文本语料库ReadabilityCorpusDataset-vikazrajpurohit 数据来源：互联网公开数据标签：文本分析，可读性评估，数据集，自然语言处理，教育研究，机器学习，语料库，语言技术数据概述：该数据集包含用于可读性评估的文本数据，记录了多种不同难度级别的文本样本。主要特征如下：时间跨度：...

ZIP

电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar

2025年4月24日

电影相似度搜索数据集PopularMoviesSimilaritySearchDataset-omgits0mar 数据来源：互联网公开数据标签：电影，数据集，推荐系统，相似度分析，自然语言处理，机器学习，娱乐分析，影视产业数据概述：该数据集包含来自互联网的电影数据，记录了多部受欢迎电影的详细信息及其相似度评分。主要特征如下：...

ZIP

Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang

2025年4月24日

Quora问答配对训练数据集QuoraQuestionPairTrainingDataset-ankitnarang 数据来源：互联网公开数据标签：问答配对，数据集，自然语言处理，文本相似度，机器学习，数据挖掘，信息检索，知识图谱数据概述：该数据集包含来自Quora问答平台的配对问题数据，记录了成对的问题及其相似性标签。主要特征如下：...

ZIP

垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs

2025年4月24日

垃圾邮件过滤数据集PudhusuSpamHamDataset-gopikavs 数据来源：互联网公开数据标签：垃圾邮件，邮件过滤，数据集，自然语言处理，文本分类，机器学习，信息检索，垃圾邮件检测数据概述：该数据集包含了大量标记为垃圾邮件（spam）和正常邮件（ham）的邮件数据，主要用于垃圾邮件过滤模型的训练和评估。主要特征如下：...

ZIP

电影用户评论数据集16部电影烂番茄评论数据集-jonsteve

2025年4月24日

电影用户评论数据集16部电影烂番茄评论数据集-jonsteve 数据来源：互联网公开数据标签：电影评论，数据集，电影分析，自然语言处理，情感分析，用户反馈，电影推荐，娱乐研究数据概述：该数据集包含来自烂番茄网站的16部电影的用户评论数据，记录了用户对这些电影的具体评价和评分。主要特征如下：时间跨度：数据记录的时间范围从2010年到2023年。...

ZIP

医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil

2025年4月24日

医生与患者对话数据集Doctor-PatientConversationPairCSVDataset-azmayensabil 数据来源：互联网公开数据标签：医疗对话，自然语言处理，数据集，医疗AI，临床分析，机器学习，健康咨询，对话系统数据概述：该数据集包含来自医疗场景的医生与患者对话记录，记录了医生与患者之间的交流内容。主要特征如下：...

ZIP

自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk

2025年4月24日

自然语言处理与大型语言模型对比数据集NLPvsLLMDemoData1CSV-nischaydnk 数据来源：互联网公开数据标签：自然语言处理，大型语言模型，数据集，文本分析，机器学习，人工智能，语言模型，对比研究数据概述：...

ZIP

YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty

2025年4月24日

YouTube视频字幕索引数据集YouTubeTranscriptIndexDataset-devmohanty 数据来源：互联网公开数据标签：视频字幕，数据集，自然语言处理，文本分析，机器学习，数据挖掘，多媒体，人工智能数据概述：该数据集包含来自YouTube平台的视频字幕数据，记录了视频内容的文字转录信息。主要特征如下：...

ZIP

法律领域分类数据集LegalAreasClassificationDataset-mohit3430

2025年4月24日

法律领域分类数据集LegalAreasClassificationDataset-mohit3430 数据来源：互联网公开数据标签：法律，数据集，分类，机器学习，自然语言处理，文本分析，人工智能，法律研究数据概述：该数据集包含来自法律领域的文本数据，记录了不同法律领域的案例，法规和判决等信息。主要特征如下：...

ZIP

电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra

2025年4月24日

电子邮件垃圾邮件过滤数据集Spambase数据集-otaviomserra 数据来源：互联网公开数据标签：垃圾邮件，电子邮件，文本分类，机器学习，数据集，自然语言处理，信息检索，数据挖掘数据概述：该数据集包含来自 UCI 机器学习数据库的电子邮件数据，用于垃圾邮件过滤研究。主要特征如下：时间跨度：数据记录时间不明确，但可推断为收集于互联网早期。...

ZIP

深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh

2025年4月24日

深度学习模型自然语言处理数据集DeepLearningModelNLPDataset-anthiendinh 数据来源：互联网公开数据标签：自然语言处理，深度学习，数据集，文本分析，机器学习，语言模型，文本分类，情感分析数据概述：该数据集包含用于自然语言处理的深度学习模型训练和评估的数据，记录了多种文本类型和任务的数据。主要特征如下：...

ZIP

统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny

2025年4月24日

统计与词频计数数据集StatsWordCountwithWSDataset-jjleesunny 数据来源：互联网公开数据标签：统计分析，词频计数，数据集，文本分析，自然语言处理，文本挖掘，数据科学，数据处理数据概述：该数据集包含来自多个来源的文本数据，记录了不同文本的词频计数信息，适用于文本分析和词频统计等任务。主要特征如下：...

ZIP

推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147

2025年4月24日

推特用户退休推文数据集DhoniretiresTwitterData-kaushiksuresh147 数据来源：互联网公开数据标签：推特，退休，数据集，社交媒体，文本分析，情感分析，自然语言处理，用户行为数据概述：该数据集包含推特（Twitter）上与退休相关的数据，记录了用户发布的推文信息。主要特征如下：...

ZIP

预处理与词形还原测试数据数据集-marouanesidali

2025年4月24日

预处理与词形还原测试数据数据集-marouanesidali 数据来源：互联网公开数据标签：文本预处理，词形还原，自然语言处理，数据集，文本分析，机器学习，NLP，测试数据数据概述：该数据集包含了经过预处理和词形还原处理的文本数据，主要用于测试和评估文本处理算法的性能。主要特征如下：...

ZIP

IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101

2025年4月24日

IMDB电影评分与评论数据集IMDBMovieRatingsandReviewsDataset-cdr0101 数据来源：互联网公开数据标签：电影评分，用户评论，数据集，情感分析，自然语言处理，数据挖掘，电影研究，机器学习数据概述：...

ZIP

极端言论检测数据集ExtremismDetectionDataset-ftgroups

2025年4月24日

极端言论检测数据集ExtremismDetectionDataset-ftgroups 数据来源：互联网公开数据标签：文本分析，极端言论，数据集，机器学习，自然语言处理，安全研究，社会研究，情感分析数据概述：该数据集包含来自网络平台和社交媒体的文本数据，记录了不同类型的极端言论内容。主要特征如下：...

ZIP

Pneuma基准测试数据集-luthfibalaka

2025年4月24日

Pneuma基准测试数据集-luthfibalaka 数据来源：互联网公开数据标签：Pneuma，基准测试，自然语言处理，机器学习，文本生成，模型评估，文本分析，人工智能数据概述：该数据集包含Pneuma项目发布的基准测试数据，用于评估自然语言处理模型的性能，特别是在文本生成和文本理解方面。主要特征如下：...

ZIP

英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba

2025年4月24日

英语与法语意图分类数据集IntentClassificationEnglish-FrenchDataset-husainkhatba 数据来源：互联网公开数据标签：自然语言处理，意图分类，数据集，机器学习，双语，文本分析，语言模型，机器翻译数据概述：该数据集记录了英语和法语文本的意图分类信息，主要用于训练和评估跨语言的意图识别模型。主要特征如下：...

ZIP

找到11,829个数据集

注册成功！