-
波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370
波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,数据挖掘,机器学习,自然语言处理,健康传播,社会媒体 数据概述: 该数据集包含来自波斯语新闻平台的新冠相关虚假新闻数据,记录了波斯语环境中关于新冠疫情的失实报道和谣言。主要特征如下:... -
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23
GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据隐私,GDPR,问答系统,自然语言处理,法律合规,数据保护,机器学习,文本分析 数据概述: 该数据集包含与欧盟通用数据保护条例(GDPR)相关的问答对,用于测试和评估问答系统在数据隐私领域的性能。主要特征如下:... -
推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth
推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,机器学习,自然语言处理,航空业,文本挖掘,客户服务 数据概述:... -
大型语言模型数据集LlamaDataset-simakov
大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:... -
Wordle游戏数据集WordleGameDataset-senorisky
Wordle游戏数据集WordleGameDataset-senorisky 数据来源:互联网公开数据 标签:游戏数据,数据分析,自然语言处理,词频统计,教育研究,人工智能,语言学习,数据挖掘 数据概述: 该数据集包含来自 Wordle 游戏的历史游戏数据,记录了玩家在 Wordle 游戏中的每日猜测和结果。主要特征如下:... -
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand
GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:... -
股票市场新闻数据集-arthuruguendemendona
股票市场新闻数据集-arthuruguendemendona 数据来源:互联网公开数据 标签:股票市场,新闻,情感分析,自然语言处理,金融科技,文本分析,市场预测,机器学习 数据概述: 该数据集包含来自各种新闻来源的股票市场相关新闻文章,记录了股票市场的新闻事件和市场情绪。主要特征如下: 时间跨度:数据记录的时间范围从[起始年份]到[结束年份]。... -
巴西电商评论翻译数据集EnglishTranslatedReviewsforBrazilianE-commDataset-slimeee8888
巴西电商评论翻译数据集EnglishTranslatedReviewsforBrazilianE-commDataset-slimeee8888 数据来源:互联网公开数据 标签:电商评论,数据集,机器学习,自然语言处理,消费者行为,翻译,电子商务,消费者反馈... -
推特美国航空公司情感分析数据集TwitterUSAirlineSentimentalAnalysisDataset-shivanshgalav
推特美国航空公司情感分析数据集TwitterUSAirlineSentimentalAnalysisDataset-shivanshgalav 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,航空公司,机器学习,自然语言处理,文本挖掘,客户服务 数据概述:... -
数学问题解答数据集-jaimatadi22
数学问题解答数据集-jaimatadi22 数据来源:互联网公开数据 标签:数学,问题解答,数据集,教育,机器学习,自然语言处理,文本分析,算术 数据概述: 该数据集包含一系列简单的数学问题及其对应的解答。主要特征如下: 时间跨度: 数据记录的时间范围不限。 地理范围: 数据来源不限。 数据维度: 数据集包括数学问题文本,对应的正确答案。 数据格式:... -
图书推荐系统数据集BookRecommendationSystemDataset-mohitnirgulkar
图书推荐系统数据集BookRecommendationSystemDataset-mohitnirgulkar 数据来源:互联网公开数据 标签:图书,推荐系统,数据集,数据分析,机器学习,用户行为,自然语言处理,个性化推荐 数据概述: 该数据集包含来自图书推荐平台的用户行为数据,记录了用户与图书之间的互动信息。主要特征如下:... -
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee
垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee 数据来源:互联网公开数据 标签:短信分类,垃圾短信,数据集,文本分析,机器学习,自然语言处理,通信安全,数据挖掘 数据概述: 该数据集包含来自公开来源的短信数据,记录了用户收到的短信内容及其是否为垃圾短信的标签。主要特征如下:... -
土耳其语文本数据集Linux-denizhanahin
土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:... -
语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835
语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835 数据来源:互联网公开数据 标签:自然语言处理,语音识别,数据集,文本转写,机器学习,人工智能,语音技术,数据科学 数据概述: 该数据集包含来自多个语音转文本模型训练项目中的语音转录数据,记录了语音信号与对应文本之间的映射关系。主要特征如下:... -
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina
多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,句子相似度,多语言,文本分析,语义理解,深度学习 数据概述: 该数据集包含来自PAWS-X项目的多语言句子对数据,记录了不同语言中句子对的相似度关系。主要特征如下:... -
酒店顾客反馈数据集HotelCustomerFeedbackDataset-abdelhayhasnaoui
酒店顾客反馈数据集HotelCustomerFeedbackDataset-abdelhayhasnaoui 数据来源:互联网公开数据 标签:酒店业,顾客反馈,情感分析,自然语言处理,文本挖掘,用户体验,服务质量,机器学习 数据概述: 该数据集包含了酒店顾客的反馈信息,记录了顾客入住酒店后的评价和意见。主要特征如下:... -
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1
评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,相似度计算,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自网络评论的余弦相似度计算结果,记录了不同评论之间的相似度分数。主要特征如下:... -
Python编程问题数据集PythonQuestionsDataset-cdr0101
Python编程问题数据集PythonQuestionsDataset-cdr0101 数据来源:互联网公开数据 标签:编程,Python,数据集,问答,机器学习,自然语言处理,代码分析,教育技术 数据概述: 该数据集包含来自互联网的Python编程问题数据,记录了用户在编程社区或论坛中提出的Python相关问题和对应的解答。主要特征如下:... -
新闻头条股票情绪分析数据集-ayushiduggad
新闻头条股票情绪分析数据集-ayushiduggad 数据来源:互联网公开数据 标签:股票市场,情绪分析,新闻头条,自然语言处理,机器学习,文本挖掘,金融科技,市场预测 数据概述: 该数据集包含来自新闻头条的股票市场情绪分析数据,记录了与股票相关的头条新闻及其对应的市场情绪。主要特征如下:... -
局部敏感哈希LSH文档数据集-massivedatamining
局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。...