找到11,811个数据集

标签: 自然语言处理

过滤结果
  • 情绪识别社交媒体数据集EmosiDataset-SentimentAnalysisSocialMediaDataset-alfinashalya

    2025年4月24日   

    情绪识别社交媒体数据集EmosiDataset-SentimentAnalysisSocialMediaDataset-alfinashalya 数据来源:互联网公开数据 标签:情绪识别,社交媒体,数据集,自然语言处理,机器学习,情感分析,文本挖掘,社交媒体分析...
    packageimg
  • 意图分类数据集IntentClassifierDataset-interviewturabit

    2025年4月24日   

    意图分类数据集IntentClassifierDataset-interviewturabit 数据来源:互联网公开数据 标签:自然语言处理,意图识别,数据集,文本分类,机器学习,人工智能,对话系统,语义理解 数据概述: 该数据集包含用于意图分类任务的文本数据,旨在训练和评估文本分类模型,以识别用户输入文本的意图。主要特征如下:...
    packageimg
  • 网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633

    2025年4月24日   

    网络欺凌检测数据集CyberbullyingDetectionDataset-sanzidasiddike3633 数据来源:互联网公开数据 标签:网络欺凌,数据集,文本分析,自然语言处理,机器学习,情感分析,社交媒体,欺凌检测 数据概述: 该数据集包含来自社交媒体平台的文本数据,主要用于识别和分析网络欺凌行为。主要特征如下:...
    packageimg
  • IMDB电影数据集IMDBMovieDataset-nadezhdadmitrieva

    2025年4月24日   

    IMDB电影数据集IMDBMovieDataset-nadezhdadmitrieva 数据来源:互联网公开数据 标签:电影评价,数据集,情感分析,机器学习,自然语言处理,影评分析,大数据,数据挖掘 数据概述: 该数据集包含来自IMDB(互联网电影数据库)的电影评价数据,记录了用户对电影的评价和评分。主要特征如下:...
    packageimg
  • 越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen

    2025年4月24日   

    越南假新闻检测数据集PhảnhồiBìnhLuận2017-goumanguyen 数据来源:互联网公开数据 标签:假新闻,数据集,文本分析,自然语言处理,机器学习,信息诈骗,舆论监控,社会研究 数据概述: 该数据集包含来自越南“Phản hồi Bình Luận”平台的评论数据,记录了关于假新闻的文章及其评论。主要特征如下:...
    packageimg
  • 测试训练上下文大型语言模型数据集-quctngngvng

    2025年4月24日   

    测试训练上下文大型语言模型数据集-quctngngvng 数据来源:互联网公开数据 标签:大型语言模型,数据集,自然语言处理,文本生成,机器学习,模型训练,语言模型,上下文学习 数据概述: 该数据集包含用于训练和评估大型语言模型(LLM)的文本数据,专注于测试训练(Test-Train)场景下的上下文学习能力。主要特征如下: 时间跨度:...
    packageimg
  • 多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr

    2025年4月24日   

    多领域罗马乌尔都语语料库数据集Multi-DomainRomanUrduCorpusDataset-marwakhanfastnulhr 数据来源:互联网公开数据 标签:自然语言处理,语料库,罗马乌尔都语,文本分析,多领域,文本分类,机器翻译,语言学 数据概述:...
    packageimg
  • 乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan

    2025年4月24日   

    乌尔都语罗马体诗歌数据集RomanUrduPoetryDataset-mianahmadhasan 数据来源:互联网公开数据 标签:诗歌,乌尔都语,罗马体,文本分析,自然语言处理,语言学,数据集,文化研究 数据概述: 该数据集包含了用罗马字母转写的乌尔都语诗歌,旨在促进乌尔都语诗歌的文本分析和研究。主要特征如下: 时间跨度:...
    packageimg
  • 数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal

    2025年4月24日   

    数据科学问答LLM微调数据集DataScienceQ-ALLMFine-TuningDataset-divyangmandal 数据来源:互联网公开数据 标签:数据科学,问答系统,微调,机器学习,自然语言处理,数据集,人工智能,语言模型...
    packageimg
  • 手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth

    2025年4月24日   

    手机产品描述数据集PhoneProductDescriptionDataset-skywoodthefifth 数据来源:互联网公开数据 标签:电子产品,手机,数据集,文本分析,自然语言处理,产品描述,市场研究,信息提取 数据概述: 该数据集包含来自多个电商平台和手机品牌官方网站的手机产品描述数据,记录了各类手机产品的详细信息。主要特征如下:...
    packageimg
  • 医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav

    2025年4月24日   

    医疗转录数据集MedicalTranscriptionSamplesDataset-oyesaurav 数据来源:互联网公开数据 标签:医疗,转录,临床,文本分析,自然语言处理,数据集,健康,医学 数据概述: 该数据集包含来自MT Samples的临床转录数据,记录了医疗领域的各种临床报告和病历。主要特征如下:...
    packageimg
  • 邮件分类数据集EmailCategoriesDataset-tobniislam

    2025年4月24日   

    邮件分类数据集EmailCategoriesDataset-tobniislam 数据来源:互联网公开数据 标签:邮件分类,文本分析,自然语言处理,数据集,机器学习,情感分析,文本挖掘,信息检索 数据概述: 该数据集包含来自不同来源的电子邮件数据,旨在用于邮件分类和文本分析任务。主要特征如下: 时间跨度:数据记录的时间范围跨度不明确,取决于具体来源。...
    packageimg
  • 句子嵌入表示数据集SentenceEmbeddingDataset-dm4006

    2025年4月24日   

    句子嵌入表示数据集SentenceEmbeddingDataset-dm4006 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,深度学习,语义检索,信息提取,人工智能 数据概述: 该数据集包含大量的句子及其对应的嵌入向量表示,记录了文本数据通过特定算法生成的向量特征。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran

    2025年4月24日   

    虚假新闻检测数据集FakeNewsDetectionDataset-lethaldiran 数据来源:互联网公开数据 标签:新闻,虚假信息,自然语言处理,文本分类,机器学习,情感分析,社交媒体,信息安全 数据概述: 该数据集包含经过预处理并使用GloVe词嵌入的虚假新闻检测数据,记录了新闻文章的文本内容及其真实性标签。主要特征如下:...
    packageimg
  • 沐浴露与香皂产品评论数据集-aritropaul

    2025年4月24日   

    沐浴露与香皂产品评论数据集-aritropaul 数据来源:互联网公开数据 标签:产品评论,沐浴露,香皂,情感分析,自然语言处理,消费者行为,市场调研,文本挖掘 数据概述: 该数据集包含来自电商平台和社交媒体的沐浴露和香皂产品评论数据,记录了用户对产品的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围不确定,取决于数据来源,可能涵盖数年。...
    packageimg
  • 歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa

    2025年4月24日   

    歌曲歌词与翻译数据集SongLyricsandTranslationDataset-auroralarrosa 数据来源:互联网公开数据 标签:歌词,翻译,数据集,音乐,自然语言处理,文本分析,多语言,机器翻译 数据概述: 该数据集包含了大量歌曲的歌词及其对应的翻译文本。主要特征如下: 时间跨度:数据记录的时间范围涵盖了不同年代的歌曲。...
    packageimg
  • Alpaca新闻文章数据集2018-2023-prabhuanem

    2025年4月24日   

    Alpaca新闻文章数据集2018-2023-prabhuanem 数据来源:互联网公开数据 标签:新闻文章,数据集,自然语言处理,文本分析,时间序列,机器学习,新闻媒体,金融 数据概述:该数据集包含来自 Alpaca 平台的新闻文章数据,记录了自2018年至2023年期间发布的新闻文章。主要特征如下:...
    packageimg
  • 超市管理自然语言到SQL转换数据集NaturalLanguagetoSQLforGroceryManagementDataset-soumyasavarn

    2025年4月24日   

    超市管理自然语言到SQL转换数据集NaturalLanguagetoSQLforGroceryManagementDataset-soumyasavarn 数据来源:互联网公开数据 标签:自然语言处理,SQL转换,数据集,超市管理,数据分析,机器学习,商业智能,零售业 数据概述:...
    packageimg
  • 古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq

    2025年4月24日   

    古腾堡出版物订单数据集GutenbergPublicationsOrdersDataset-imumerfarooq 数据来源:互联网公开数据 标签:出版物,订单数据,古腾堡项目,文本分析,自然语言处理,数据集,电子书,销售分析 数据概述: 该数据集包含来自古腾堡项目(Project...
    packageimg
  • 优质评论数据集GoodStuffCommentsDataset-amazingbigtree

    2025年4月24日   

    优质评论数据集GoodStuffCommentsDataset-amazingbigtree 数据来源:互联网公开数据 标签:评论分析,社交媒体,数据集,文本挖掘,情感分析,自然语言处理,用户反馈,质量评估 数据概述:该数据集包含来自互联网公开平台的用户评论数据,记录了用户对不同产品或服务的评价和反馈。主要特征如下:...
    packageimg