找到11,858个数据集

标签: 自然语言处理

过滤结果
  • 流行歌曲歌词创作与专辑数据分析数据集

    2025年4月25日   

    流行歌曲歌词创作与专辑数据分析数据集 数据来源:互联网公开数据 标签:歌词,歌曲,音乐,流行音乐,NLP,自然语言处理,创作,专辑,歌手,情感分析 数据概述: 本数据集收录了超过25,000首歌曲的详细信息及其歌词文本,并包含了这些歌曲所属专辑的相关信息。数据涵盖了150位歌手的歌词,其中包含了Taylor Swift、Ariana...
    packageimg
  • 移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri

    2025年4月25日   

    移动应用用户评论情感分析数据集ReviewMobileJKNDataset-saprinasaputri 数据来源:互联网公开数据 标签:移动应用,用户评论,情感分析,自然语言处理,机器学习,文本挖掘,情感分类,应用商店 数据概述: 该数据集包含来自移动应用的用户评论数据,主要用于情感分析和用户反馈研究。主要特征如下: 时间跨度:...
    packageimg
  • 阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta

    2025年4月25日   

    阿萨姆语多类别仇恨言论标注数据集AssameseMulti-ClassHateSpeechTaggedDataset-ashisdta 数据来源:互联网公开数据 标签:仇恨言论,数据集,自然语言处理,多类别分类,文本标注,社交媒体,阿萨姆语,人工智能 数据概述:...
    packageimg
  • 新闻媒体情感分析数据集KompasDataset-anandaprayoga

    2025年4月25日   

    新闻媒体情感分析数据集KompasDataset-anandaprayoga 数据来源:互联网公开数据 标签:新闻媒体,情感分析,数据集,文本分析,自然语言处理,机器学习,社会研究,新闻学 数据概述: 该数据集包含来自印尼新闻网站Kompas.com的文章,记录了大量新闻报道的内容及其对应的情感标签,适用于新闻情感分析和机器学习任务。主要特征如下:...
    packageimg
  • 客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01

    2025年4月25日   

    客户支持对话文本数据集Bitext客户支持训练数据集-pragadeeshn01 数据来源:互联网公开数据 标签:客户支持,对话,文本分析,自然语言处理,机器学习,数据集,语义理解,客户服务 数据概述: 该数据集包含来自 Bitext 公司的客户支持对话文本,旨在用于训练和评估客户支持相关的自然语言处理模型。主要特征如下: 时间跨度:...
    packageimg
  • 微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222

    2025年4月25日   

    微软OCR无缩放数据集MicrosoftOCRWithoutResizeDataset-mostafaatta222 数据来源:互联网公开数据 标签:OCR, 数据集, 文本识别, 机器学习, 图像处理, 自然语言处理, 文档分析, 软件工程 数据概述:...
    packageimg
  • 知乎用户行为数据集ZhihuUserBehaviorDataset-yougebuding

    2025年4月25日   

    知乎用户行为数据集ZhihuUserBehaviorDataset-yougebuding 数据来源:互联网公开数据 标签:社交媒体,用户行为,数据集,数据分析,机器学习,知识图谱,用户画像,自然语言处理 数据概述: 该数据集包含来自知乎平台的用户行为数据,记录了用户在知乎上的各种活动信息。主要特征如下: 时间跨度:数据记录的时间范围为特定时期。...
    packageimg
  • 贝叶斯特征分析数据集BayesFeaturesDataset-faisalmabood

    2025年4月25日   

    贝叶斯特征分析数据集BayesFeaturesDataset-faisalmabood 数据来源:互联网公开数据 标签:贝叶斯分析,特征提取,数据集,机器学习,概率模型,自然语言处理,数据挖掘,统计分析 数据概述: 该数据集包含来自多个来源的贝叶斯特征数据,记录了基于贝叶斯统计方法提取的特征信息。主要特征如下:...
    packageimg
  • 医学笔记评估与伪标签数据集NBMEPseudoLabelingDataset-lunapandachan

    2025年4月25日   

    医学笔记评估与伪标签数据集NBMEPseudoLabelingDataset-lunapandachan 数据来源:互联网公开数据 标签:医学评估,伪标签,数据集,自然语言处理,机器学习,医学教育,文本分析,人工智能 数据概述: 该数据集来源于医学笔记评估(NBME)项目,包含医学教育中的伪标签数据,用于辅助医学笔记的评估和分类。主要特征如下:...
    packageimg
  • AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii

    2025年4月25日   

    AMD新闻文章数据集AMDNewsArticlesDataset-mingjjii 数据来源:互联网公开数据 标签:新闻文章,数据集,科技新闻,AMD,自然语言处理,文本分析,机器学习,信息提取 数据概述: 该数据集包含来自互联网公开渠道的与AMD公司相关的新闻文章数据,记录了关于AMD公司的新闻报道和相关信息。主要特征如下:...
    packageimg
  • 文本摘要数据集TextSummarizationDataset-dngnguynanh12

    2025年4月25日   

    文本摘要数据集TextSummarizationDataset-dngnguynanh12 数据来源:互联网公开数据 标签:文本摘要,自然语言处理,数据集,机器学习,深度学习,NLP,文本分析,信息检索 数据概述: 该数据集包含大量文本及其对应的摘要,旨在用于训练和评估文本摘要模型。主要特征如下:...
    packageimg
  • 生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi

    2025年4月25日   

    生成式预训练模型与大型语言模型数据集GeminiProLLMDAIGTDataset-asalhi 数据来源:互联网公开数据 标签:自然语言处理,生成式AI,数据集,机器学习,语言模型,文本生成,深度学习,人工智能 数据概述: 该数据集包含来自生成式预训练模型与大型语言模型(LLM)的研究数据,记录了模型在文本生成,语言理解等方面的表现。主要特征如下:...
    packageimg
  • 情感分析数据集SentimentAnalysisDataset-qacenn

    2025年4月25日   

    情感分析数据集SentimentAnalysisDataset-qacenn 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,机器学习,文本分类,数据挖掘,语言技术,人工智能 数据概述: 该数据集包含来自互联网公开来源的情感分析数据,记录了用户对产品,服务或内容的情感倾向。主要特征如下:...
    packageimg
  • 问题集数据集Question-SetDataset-tanujsaxena

    2025年4月25日   

    问题集数据集Question-SetDataset-tanujsaxena 数据来源:互联网公开数据 标签:问题集,数据集,自然语言处理,文本分析,机器学习,教育研究,问答系统,人工智能 数据概述: 该数据集包含来自公开来源的问题集合,记录了各类问题的文本内容和相关信息。主要特征如下: 时间跨度:数据记录的时间范围从近年到当前。...
    packageimg
  • 网络欺凌预测数据集BalancedCyberbullyingPredictionDataset-sanzidasiddike

    2025年4月25日   

    网络欺凌预测数据集BalancedCyberbullyingPredictionDataset-sanzidasiddike 数据来源:互联网公开数据 标签:网络欺凌,情感分析,文本分类,机器学习,社交媒体,欺凌检测,自然语言处理,数据集 数据概述:...
    packageimg
  • LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand

    2025年4月25日   

    LLM提示词恢复数据集LLMDataforPromptRecoveryDataset-ehsaasdhand 数据来源:互联网公开数据 标签:大型语言模型,提示词,数据集,自然语言处理,信息检索,机器学习,文本分析,模型训练 数据概述: 该数据集包含了用于研究和开发大型语言模型(LLM)提示词恢复技术的数据。主要特征如下:...
    packageimg
  • 语言分类测试数据集TestLanguageClassificationDataset-jhaamanvaibhav

    2025年4月25日   

    语言分类测试数据集TestLanguageClassificationDataset-jhaamanvaibhav 数据来源:互联网公开数据 标签:语言分类,数据集,自然语言处理,机器学习,文本分析,文本挖掘,人工智能,计算机科学 数据概述:该数据集包含来自多种语言的文本数据,适用于语言分类和识别任务。主要特征如下:...
    packageimg
  • 电影标题-评分-摘要与情节数据集-arnavsharmaas

    2025年4月25日   

    电影标题-评分-摘要与情节数据集-arnavsharmaas 数据来源:互联网公开数据 标签:电影,评分,摘要,情节,文本分析,情感分析,电影评论,自然语言处理 数据概述: 该数据集包含电影的标题,评分,摘要和情节概要信息。主要特征如下: 时间跨度:数据记录的时间范围覆盖了不同年代的电影。...
    packageimg
  • 语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv

    2025年4月25日   

    语言模型学生平等数据集EqualTokenDataforLLMStudentsDataset-hemanthhvv 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,教育,学生,语言模型,平等化,文本分析...
    packageimg
  • 新冠疫情主题下的社交媒体讨论数据集SubthemesDataset-COVID-19PandemicSocialMediaDiscussionDatase...

    2025年4月25日   

    新冠疫情主题下的社交媒体讨论数据集SubthemesDataset-COVID-19PandemicSocialMediaDiscussionDataset-vishalroy02 数据来源:互联网公开数据 标签:新冠疫情,社交媒体,数据集,主题分析,情感分析,自然语言处理,文本挖掘,公共卫生 数据概述:...
    packageimg