-
计算机科学文献数据集DBLP数据集2022-jakboss
计算机科学文献数据集DBLP数据集2022-jakboss 数据来源:互联网公开数据 标签:计算机科学,文献数据,数据集,学术研究,机器学习,文本分析,知识图谱,信息检索 数据概述: 该数据集包含来自DBLP(Digital Bibliography & Library... -
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-naveenkarthikr
电影评论情感分析数据集MovieReviewSentimentAnalysisDataset-naveenkarthikr 数据来源:互联网公开数据 标签:情感分析,电影评论,数据集,自然语言处理,机器学习,文本分析,文本挖掘,数据科学 数据概述: 该数据集包含来自电影评论网站的数据,记录了用户对电影的评价及其情感倾向。主要特征如下:... -
预处理语言数据集PreprocessingLanguageData-biatrixwang
预处理语言数据集PreprocessingLanguageData-biatrixwang 数据来源:互联网公开数据 标签:自然语言处理,文本预处理,数据集,语言模型,文本分析,数据清洗,机器学习,中文处理 数据概述: 该数据集包含经过预处理的语言数据,旨在为自然语言处理任务提供干净,规范的文本输入。主要特征如下:... -
数据2023年Reddit平台关于iPhone和Apple的讨论数据集ScrappedRedditData-iPhoneAppleDiscussionsi...
2023年Reddit平台关于iPhone和Apple的讨论数据集ScrappedRedditData-iPhoneAppleDiscussionsin2023-muhammadhussain11 数据来源:互联网公开数据 标签:社交媒体,Reddit,iPhone,Apple,用户评论,数据挖掘,文本分析,消费者行为 数据概述:... -
大学建议与分类数据集UniversitySuggestionsandCategorizationDataset-pteacher
大学建议与分类数据集UniversitySuggestionsandCategorizationDataset-pteacher 数据来源:互联网公开数据 标签:教育,大学,建议,分类,数据集,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开渠道的大学建议与分类数据,记录了针对不同大学的建议和分类信息。主要特征如下:... -
土耳其地震推文数据集TurkeyEarthquakeTweetsDataset-serkanp
土耳其地震推文数据集TurkeyEarthquakeTweetsDataset-serkanp 数据来源:互联网公开数据 标签:地震,推文,社交媒体,自然灾害,土耳其,文本分析,情感分析,机器学习 数据概述: 该数据集包含了来自Twitter(推特)的推文数据,记录了关于2023年土耳其地震的相关信息。主要特征如下:... -
情感分析大数据集SentimentAnalysisBigCorpus-esrapolatnevruz
情感分析大数据集SentimentAnalysisBigCorpus-esrapolatnevruz 数据来源:互联网公开数据 标签:情感分析,自然语言处理,大数据,文本分析,机器学习,人工智能,数据挖掘,社会研究 数据概述:... -
电商产品评论数据集YojoE-commerceProductReviewsDataset-yohanesnuwara
电商产品评论数据集YojoE-commerceProductReviewsDataset-yohanesnuwara 数据来源:互联网公开数据 标签:电商,产品评论,数据集,文本分析,情感分析,机器学习,消费者行为,自然语言处理 数据概述: 该数据集包含来自Yojo电商平台的产品评论数据,记录了消费者对各类产品的评价和反馈。主要特征如下:... -
英国广播公司僧伽罗语新闻数据集BBCSinhalaDataset-kawinduwijewardhane
英国广播公司僧伽罗语新闻数据集BBCSinhalaDataset-kawinduwijewardhane 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,语言学,僧伽罗语,机器学习,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)僧伽罗语频道的新闻文章数据,记录了BBC僧伽罗语新闻文章的详细信息。主要特征如下:... -
作家差异识别数据集WriterDifferenceIdentificationDataset-amrrsheta
作家差异识别数据集WriterDifferenceIdentificationDataset-amrrsheta 数据来源:互联网公开数据 标签:笔迹识别,数据集,机器学习,文本分析,人工智能,模式识别,数据分析,教育技术 数据概述: 该数据集包含来自不同作家的笔迹样本数据,用于识别和区分不同作家的书写风格。主要特征如下:... -
行业NLP应用数据集NLPinIndustryDataset-jeanthomasfc
行业NLP应用数据集NLPinIndustryDataset-jeanthomasfc 数据来源:互联网公开数据 标签:自然语言处理,行业应用,数据集,文本分析,机器学习,信息抽取,情感分析,数据挖掘 数据概述: 该数据集包含来自多个行业领域的文本数据,旨在促进自然语言处理(NLP)在实际工业场景中的应用研究。主要特征如下:... -
客户服务分析数据集-nvlkumar
客户服务分析数据集-nvlkumar 数据来源:互联网公开数据 标签:客户服务,文本分析,自然语言处理,情感分析,数据集,机器学习,客户体验,服务质量 数据概述: 该数据集包含来自客户服务交互的数据,记录了客户与服务提供商之间的对话内容。主要特征如下: 时间跨度:数据记录的时间范围为一段时间,具体时间范围依赖于数据集的发布者,可能包含多个月甚至数年。... -
比尔盖茨推特数据集2009年至2023年BillGatesTweetsDatasetfrom2009to2023-muhammadavici
比尔盖茨推特数据集2009年至2023年BillGatesTweetsDatasetfrom2009to2023-muhammadavici 数据来源:互联网公开数据 标签:比尔盖茨,推特,社交媒体,数据集,时间序列,文本分析,社会影响,科技发展... -
Statement1文件数据集-morizin
Statement1文件数据集-morizin 数据来源:互联网公开数据 标签:财务报表,数据集,文本分析,自然语言处理,会计学,金融,机器学习,文本挖掘 数据概述:该数据集包含来自Statement1 文件的财务报表数据,记录了公司的财务状况和业绩表现。主要特征如下: 时间跨度:数据记录的时间范围涵盖多个年度。 地理范围:数据来源于全球范围内的公司。... -
Mistral-7B生成文本数据集-thienanlnguyen
Mistral-7B生成文本数据集-thienanlnguyen 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本生成,机器学习,语言模型,生成式AI,文本分析,人工智能 数据概述: 该数据集包含由 Mistral-7B 语言模型生成的文本数据,用于研究和评估模型的文本生成能力。主要特征如下: 时间跨度:数据生成时间为近期。... -
短信分类数据集SMSClassifierDataset-prasaddablikar
短信分类数据集SMSClassifierDataset-prasaddablikar 数据来源:互联网公开数据 标签:短信分类,数据集,文本分析,机器学习,自然语言处理,分类算法,通信技术,数据挖掘 数据概述: 该数据集包含来自通信运营商的短信数据,记录了各类短信的文本内容和分类标签。主要特征如下:... -
Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544
Reddit平台清洁笑话数据集RedditCleanJokesDataset-qwerty29544 数据来源:互联网公开数据 标签:笑话,数据集,社交媒体,文本分析,自然语言处理,情感分析,娱乐内容,数据分析 数据概述: 该数据集包含来自Reddit平台的清洁笑话数据,记录了用户发布的无冒犯内容的笑话。主要特征如下:... -
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema
城市词典拼写变体数据集SpellingVariationonUrbanDictionaryDataset-paigema 数据来源:互联网公开数据 标签:语言研究,数据集,拼写变体,词典学,自然语言处理,词汇学,文本分析,机器学习 数据概述: 该数据集包含来自城市词典(Urban... -
书籍推荐数据集BXBookDataset-alizaynoor
书籍推荐数据集BXBookDataset-alizaynoor 数据来源:互联网公开数据 标签:书籍,图书,推荐系统,数据集,用户行为,文本分析,自然语言处理,机器学习 数据概述: 该数据集包含来自BX Book数据集的书籍和用户行为数据,记录了用户的书籍阅读和评分信息。主要特征如下: 时间跨度:数据记录的时间范围为2002年之前。... -
伊朗波斯语文本数据集PersianDatasetIR-amirali10281
伊朗波斯语文本数据集PersianDatasetIR-amirali10281 数据来源:互联网公开数据 标签:波斯语,文本分析,自然语言处理,数据集,信息检索,情感分析,语言模型,机器学习 数据概述: 该数据集包含来自伊朗的波斯语文本数据,涵盖了多种来源和主题。主要特征如下:...