找到11,864个数据集

标签: 自然语言处理

过滤结果
  • 波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370

    2025年4月25日   

    波斯语虚假新冠新闻数据集PersianFakeCoronaNewsDataset-omidsakaki1370 数据来源:互联网公开数据 标签:新闻分析,虚假信息,数据集,数据挖掘,机器学习,自然语言处理,健康传播,社会媒体 数据概述: 该数据集包含来自波斯语新闻平台的新冠相关虚假新闻数据,记录了波斯语环境中关于新冠疫情的失实报道和谣言。主要特征如下:...
    packageimg
  • GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23

    2025年4月25日   

    GDPR咨询问答测试数据集GDPRQ-ATestDataset-iuliabunescu23 数据来源:互联网公开数据 标签:数据隐私,GDPR,问答系统,自然语言处理,法律合规,数据保护,机器学习,文本分析 数据概述: 该数据集包含与欧盟通用数据保护条例(GDPR)相关的问答对,用于测试和评估问答系统在数据隐私领域的性能。主要特征如下:...
    packageimg
  • 推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth

    2025年4月25日   

    推特美国航空公司情感分析数据集TwitterUSAirlineSentimentCleanedData-railoth 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,机器学习,自然语言处理,航空业,文本挖掘,客户服务 数据概述:...
    packageimg
  • 大型语言模型数据集LlamaDataset-simakov

    2025年4月25日   

    大型语言模型数据集LlamaDataset-simakov 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本数据,语言模型,预训练,人工智能,文本生成 数据概述: 该数据集包含 Llama 项目收集的用于训练大型语言模型的数据,旨在支持文本生成,对话理解等多种自然语言处理任务。主要特征如下:...
    packageimg
  • Wordle游戏数据集WordleGameDataset-senorisky

    2025年4月25日   

    Wordle游戏数据集WordleGameDataset-senorisky 数据来源:互联网公开数据 标签:游戏数据,数据分析,自然语言处理,词频统计,教育研究,人工智能,语言学习,数据挖掘 数据概述: 该数据集包含来自 Wordle 游戏的历史游戏数据,记录了玩家在 Wordle 游戏中的每日猜测和结果。主要特征如下:...
    packageimg
  • GPT生成文本数据集GPT-GeneratedTextDataset-manshanand

    2025年4月25日   

    GPT生成文本数据集GPT-GeneratedTextDataset-manshanand 数据来源:互联网公开数据 标签:自然语言处理,文本生成,数据集,机器学习,人工智能,语言模型,文本分析,深度学习 数据概述: 该数据集包含由GPT(生成预训练转换器)模型生成的文本数据,记录了模型在不同输入下的输出文本。主要特征如下:...
    packageimg
  • 股票市场新闻数据集-arthuruguendemendona

    2025年4月25日   

    股票市场新闻数据集-arthuruguendemendona 数据来源:互联网公开数据 标签:股票市场,新闻,情感分析,自然语言处理,金融科技,文本分析,市场预测,机器学习 数据概述: 该数据集包含来自各种新闻来源的股票市场相关新闻文章,记录了股票市场的新闻事件和市场情绪。主要特征如下: 时间跨度:数据记录的时间范围从[起始年份]到[结束年份]。...
    packageimg
  • 巴西电商评论翻译数据集EnglishTranslatedReviewsforBrazilianE-commDataset-slimeee8888

    2025年4月25日   

    巴西电商评论翻译数据集EnglishTranslatedReviewsforBrazilianE-commDataset-slimeee8888 数据来源:互联网公开数据 标签:电商评论,数据集,机器学习,自然语言处理,消费者行为,翻译,电子商务,消费者反馈...
    packageimg
  • 推特美国航空公司情感分析数据集TwitterUSAirlineSentimentalAnalysisDataset-shivanshgalav

    2025年4月25日   

    推特美国航空公司情感分析数据集TwitterUSAirlineSentimentalAnalysisDataset-shivanshgalav 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,航空公司,机器学习,自然语言处理,文本挖掘,客户服务 数据概述:...
    packageimg
  • 数学问题解答数据集-jaimatadi22

    2025年4月25日   

    数学问题解答数据集-jaimatadi22 数据来源:互联网公开数据 标签:数学,问题解答,数据集,教育,机器学习,自然语言处理,文本分析,算术 数据概述: 该数据集包含一系列简单的数学问题及其对应的解答。主要特征如下: 时间跨度: 数据记录的时间范围不限。 地理范围: 数据来源不限。 数据维度: 数据集包括数学问题文本,对应的正确答案。 数据格式:...
    packageimg
  • 图书推荐系统数据集BookRecommendationSystemDataset-mohitnirgulkar

    2025年4月25日   

    图书推荐系统数据集BookRecommendationSystemDataset-mohitnirgulkar 数据来源:互联网公开数据 标签:图书,推荐系统,数据集,数据分析,机器学习,用户行为,自然语言处理,个性化推荐 数据概述: 该数据集包含来自图书推荐平台的用户行为数据,记录了用户与图书之间的互动信息。主要特征如下:...
    packageimg
  • 垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee

    2025年4月25日   

    垃圾短信分类数据集SpamSMSClassificationDataset-geetmukherjee 数据来源:互联网公开数据 标签:短信分类,垃圾短信,数据集,文本分析,机器学习,自然语言处理,通信安全,数据挖掘 数据概述: 该数据集包含来自公开来源的短信数据,记录了用户收到的短信内容及其是否为垃圾短信的标签。主要特征如下:...
    packageimg
  • 土耳其语文本数据集Linux-denizhanahin

    2025年4月25日   

    土耳其语文本数据集Linux-denizhanahin 数据来源:互联网公开数据 标签:土耳其语,文本,数据集,自然语言处理,语言模型,文本分析,机器翻译,Linux 数据概述: 该数据集包含来自Linux环境下的土耳其语文本数据,主要记录了各种Linux系统和应用程序的土耳其语文本信息。主要特征如下:...
    packageimg
  • 语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835

    2025年4月25日   

    语音转文本模型训练数据集TokenizerTranscriptsDataset-piyush223835 数据来源:互联网公开数据 标签:自然语言处理,语音识别,数据集,文本转写,机器学习,人工智能,语音技术,数据科学 数据概述: 该数据集包含来自多个语音转文本模型训练项目中的语音转录数据,记录了语音信号与对应文本之间的映射关系。主要特征如下:...
    packageimg
  • 多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina

    2025年4月25日   

    多语言句子对相似度数据集PAWS-XAnchorsDataset-themirachathumina 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,句子相似度,多语言,文本分析,语义理解,深度学习 数据概述: 该数据集包含来自PAWS-X项目的多语言句子对数据,记录了不同语言中句子对的相似度关系。主要特征如下:...
    packageimg
  • 酒店顾客反馈数据集HotelCustomerFeedbackDataset-abdelhayhasnaoui

    2025年4月25日   

    酒店顾客反馈数据集HotelCustomerFeedbackDataset-abdelhayhasnaoui 数据来源:互联网公开数据 标签:酒店业,顾客反馈,情感分析,自然语言处理,文本挖掘,用户体验,服务质量,机器学习 数据概述: 该数据集包含了酒店顾客的反馈信息,记录了顾客入住酒店后的评价和意见。主要特征如下:...
    packageimg
  • 评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1

    2025年4月25日   

    评论余弦相似度结果数据集YorumCosineSimilaritySonuclariDataset-hasankuluk1 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,相似度计算,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自网络评论的余弦相似度计算结果,记录了不同评论之间的相似度分数。主要特征如下:...
    packageimg
  • Python编程问题数据集PythonQuestionsDataset-cdr0101

    2025年4月25日   

    Python编程问题数据集PythonQuestionsDataset-cdr0101 数据来源:互联网公开数据 标签:编程,Python,数据集,问答,机器学习,自然语言处理,代码分析,教育技术 数据概述: 该数据集包含来自互联网的Python编程问题数据,记录了用户在编程社区或论坛中提出的Python相关问题和对应的解答。主要特征如下:...
    packageimg
  • 新闻头条股票情绪分析数据集-ayushiduggad

    2025年4月25日   

    新闻头条股票情绪分析数据集-ayushiduggad 数据来源:互联网公开数据 标签:股票市场,情绪分析,新闻头条,自然语言处理,机器学习,文本挖掘,金融科技,市场预测 数据概述: 该数据集包含来自新闻头条的股票市场情绪分析数据,记录了与股票相关的头条新闻及其对应的市场情绪。主要特征如下:...
    packageimg
  • 局部敏感哈希LSH文档数据集-massivedatamining

    2025年4月25日   

    局部敏感哈希LSH文档数据集-massivedatamining 数据来源:互联网公开数据 标签:文本分析,局部敏感哈希,数据集,文档检索,信息检索,机器学习,自然语言处理,相似性搜索 数据概述:该数据集包含了用于研究和评估局部敏感哈希(LSH)算法的文档集合。主要特征如下: 时间跨度:数据记录的时间范围不限,取决于文档的创建时间。...
    packageimg