找到11,761个数据集

标签: 自然语言处理

过滤结果
  • 社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-rahuldshetty

    2025年5月29日   

    社交媒体情感分析推文数据集SocialMediaSentimentAnalysisTweets-rahuldshetty 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 文本挖掘, 自然语言处理, 机器学习, 推文, 情绪分类, 情感极性 数据概述: 该数据集包含来自社交媒体平台推文数据,主要用于情感分析和文本挖掘任务。主要特征如下:...
    packageimg
  • 医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999

    2025年5月29日   

    医学文献文本分类数据集MedicalLiteratureTextClassification-lunanana1999 数据来源:互联网公开数据 标签:医学文本, 文本分类, 疾病诊断, 医疗研究, 自然语言处理, 机器学习, 语料库, 临床医学 数据概述: 该数据集包含来自医学文献的文本数据,记录了用于疾病诊断和医学研究的文本片段。主要特征如下:...
    packageimg
  • 虚假新闻检测真实与虚假数据集FakeNewsDetection-RealorFakeDataset-unarinemukwevho

    2025年5月29日   

    虚假新闻检测真实与虚假数据集FakeNewsDetection-RealorFakeDataset-unarinemukwevho 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息,自然语言处理,机器学习,文本分类,信息传播,网络安全 数据概述: 该数据集包含来自网络公开渠道的新闻文章数据,记录了新闻文本及其标签(真实或虚假)。主要特征如下:...
    packageimg
  • 情感分析表情包识别训练数据集SentimentAnalysisEmoticonRecognitionTrainingData-lucca9211

    2025年5月29日   

    情感分析表情包识别训练数据集SentimentAnalysisEmoticonRecognitionTrainingData-lucca9211 数据来源:互联网公开数据 标签:情感分析, 表情包识别, 文本情感, 机器学习, 自然语言处理, 数据标注, 情感分类, 深度学习 数据概述:...
    packageimg
  • 评论社区毒性预测提交结果数据集CommunityCommentToxicityPredictionSubmissionResults-mathurinache

    2025年5月29日   

    评论社区毒性预测提交结果数据集CommunityCommentToxicityPredictionSubmissionResults-mathurinache 数据来源:互联网公开数据 标签:毒性检测, 评论分析, 文本分类, 机器学习, 自然语言处理, 情感分析, 社交媒体, 提交结果 数据概述:...
    packageimg
  • 图灵基准测试数据集TuringBenchDataset-robikiso

    2025年5月29日   

    图灵基准测试数据集TuringBenchDataset-robikiso 数据来源:互联网公开数据 标签:人工智能,自然语言处理,数据集,基准测试,模型评估,对话系统,语言模型,机器学习,文本生成 数据概述: 该数据集包含来自图灵基准测试的数据,记录了用于评估人工智能模型在各种任务上的表现,特别是自然语言理解和生成能力。主要特征如下:...
    packageimg
  • 网络评论毒性检测数据集JigsawHighlyPreprocessedDataset-ganeshgaikwad1

    2025年5月29日   

    网络评论毒性检测数据集JigsawHighlyPreprocessedDataset-ganeshgaikwad1 数据来源:互联网公开数据 标签:网络评论,毒性检测,数据集,自然语言处理,机器学习,文本分析,社交媒体,数据预处理 数据概述:该数据集来源于Jigsaw竞赛,主要包含经过高度预处理的网络评论数据,适用于 toxicity...
    packageimg
  • 印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234

    2025年5月29日   

    印地语元音辅音数据集HindiVowelsandConsonantDataset-yashwanths1234 数据来源:互联网公开数据 标签:印地语,数据集,语音识别,机器学习,自然语言处理,音素识别,学术资源,语言研究 数据概述:该数据集包含来自印度多所高校的印地语元音和辅音发音数据,记录了不同说话者的发音样本。主要特征如下:...
    packageimg
  • LLM特征数据集LLM-DF-FeaturesDataset-alvaromendizabal

    2025年5月29日   

    LLM特征数据集LLM-DF-FeaturesDataset-alvaromendizabal 数据来源:互联网公开数据 标签:大型语言模型,特征工程,数据集,自然语言处理,机器学习,文本分析,模型评估,人工智能 数据概述: 该数据集包含了从大型语言模型(LLM)中提取的各种特征,旨在用于模型评估、分析和优化。主要特征如下:...
    packageimg
  • Reddit新闻数据集RedditNewsDataset-sarahgonzalez

    2025年5月29日   

    Reddit新闻数据集RedditNewsDataset-sarahgonzalez 数据来源:互联网公开数据 标签:新闻数据,数据集,社交媒体,自然语言处理,文本分析,机器学习,社会研究,信息科学 数据概述: 该数据集包含来自Reddit网站的新闻数据,记录了Reddit平台上发布的各种新闻文章及其相关评论。主要特征如下:...
    packageimg
  • 语音识别特征数据集WhisperFeaturesDataset-aliaaosamaesmail

    2025年5月29日   

    语音识别特征数据集WhisperFeaturesDataset-aliaaosamaesmail 数据来源:互联网公开数据 标签:语音识别,特征提取,数据集,人工智能,机器学习,自然语言处理,信号处理,语音技术 数据概述: 该数据集包含来自Whisper语音识别模型的特征数据,记录了语音信号经过模型处理后的特征提取结果。主要特征如下:...
    packageimg
  • StableDiffusionv2全提示词数据集StableDiffusionv2AllPromptsDataset-gmhost

    2025年5月29日   

    StableDiffusionv2全提示词数据集StableDiffusionv2AllPromptsDataset-gmhost 数据来源:互联网公开数据 标签:人工智能,文本生成,图像生成,深度学习,计算机视觉,自然语言处理,机器学习,创意设计 数据概述: 该数据集包含来自Stable Diffusion...
    packageimg
  • 图像描述生成数据集ImageCaptioningDataset-xxxcccwork

    2025年5月29日   

    图像描述生成数据集ImageCaptioningDataset-xxxcccwork 数据来源:互联网公开数据 标签:图像识别, 文本生成, 计算机视觉, 自然语言处理, 图像标注, 深度学习, 数据集, 图像描述 数据概述: 该数据集包含图像及其对应的文字描述,旨在用于训练和评估图像描述生成模型。主要特征如下:...
    packageimg
  • 网球文章数据集TennisArticleDataset-divanshu22

    2025年5月29日   

    网球文章数据集TennisArticleDataset-divanshu22 数据来源:互联网公开数据 标签:网球,数据集,体育新闻,文本分析,机器学习,自然语言处理,体育研究,新闻数据 数据概述: 该数据集包含来自多个网球新闻来源的文章,记录了关于网球比赛、球员、教练和赛事的相关内容。主要特征如下:...
    packageimg
  • 文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan

    2025年5月29日   

    文本嵌入与标签数据集TextEmbeddingswithLabelsDataset-ishaaaaan 数据来源:互联网公开数据 标签:文本嵌入,自然语言处理,数据集,机器学习,深度学习,标签分类,文本分析,人工智能 数据概述:该数据集包含来自多个来源的文本数据及其对应标签,记录了文本的嵌入特征和分类标签。主要特征如下:...
    packageimg
  • 亚马逊商品评论测试数据集AmazonProductReviewTestDataset-tbui001

    2025年5月29日   

    亚马逊商品评论测试数据集AmazonProductReviewTestDataset-tbui001 数据来源:互联网公开数据 标签:电子商务,商品评论,数据集,自然语言处理,情感分析,机器学习,文本挖掘,消费行为 数据概述: 该数据集包含来自亚马逊平台的商品评论数据,记录了消费者对各类商品的评论内容及评分。主要特征如下:...
    packageimg
  • 教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau

    2025年5月29日   

    教育写作评估主题分析数据集EducationalWritingAssessmentTopicAnalysis-pitinghau 数据来源:互联网公开数据 标签:写作评估, 文本分析, 教育, 论文分析, 语义分析, 关键词提取, 自然语言处理, 机器学习 数据概述:...
    packageimg
  • 商品文本分类数据集ProductTextClassificationDataset-bogachevva

    2025年5月29日   

    商品文本分类数据集ProductTextClassificationDataset-bogachevva 数据来源:互联网公开数据 标签:文本分类, 商品描述, 机器学习, 自然语言处理, 数据标注, 俄语文本, 预训练模型, 数据集 数据概述:...
    packageimg
  • 布加勒斯特大学机器学习数据集Unibuc-ML2Dataset-thomaspeek

    2025年5月29日   

    布加勒斯特大学机器学习数据集Unibuc-ML2Dataset-thomaspeek 数据来源:互联网公开数据 标签:机器学习,数据集,分类,回归,文本分析,自然语言处理,学术研究,教育 数据概述: 该数据集由布加勒斯特大学(University of Bucharest)提供,主要用于机器学习和数据挖掘相关的研究和教学。主要特征如下:...
    packageimg
  • 虚假新闻检测数据集FakeNewsDetectionDataset-saidurabir

    2025年5月29日   

    虚假新闻检测数据集FakeNewsDetectionDataset-saidurabir 数据来源:互联网公开数据 标签:虚假新闻,新闻分析,自然语言处理,文本分类,机器学习,舆情分析,信息安全,社会科学 数据概述:该数据集包含来自多种来源的虚假新闻和真实新闻数据,用于训练和评估虚假新闻检测模型。主要特征如下:...
    packageimg