找到11,831个数据集

标签: 自然语言处理

过滤结果
  • 清洁有毒评论数据集

    2025年4月24日   

    清洁有毒评论数据集 数据来源:互联网公开数据 标签:有毒评论,自然语言处理,文本分类,情感分析,数据预处理 数据概述:...
    packageimg
  • 大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933

    2025年4月24日   

    大规模LLM提示语料库数据集LargeLanguageModelPromptCorpusDataset-mrt0933 数据来源:互联网公开数据 标签:自然语言处理,LLM,提示词,数据集,文本生成,人工智能,机器学习,语料库,Prompt 数据概述:...
    packageimg
  • 土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin

    2025年4月24日   

    土耳其TRT新闻文化艺术新闻数据集TRTHaberKültürSanatDataset-denizhanahin 数据来源:互联网公开数据 标签:新闻,文化,艺术,土耳其,文本分析,自然语言处理,舆情分析,数据集 数据概述: 该数据集包含来自土耳其国家广播电视台TRT Haber的文化艺术新闻数据,记录了TRT...
    packageimg
  • 阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled

    2025年4月24日   

    阿拉伯语维基百科问答数据集Wiki-ARA-QADataset-ayaaakhaled 数据来源:互联网公开数据 标签:问答系统,自然语言处理,阿拉伯语,数据集,文本分析,信息检索,机器学习,语言学 数据概述: 该数据集收录了阿拉伯语维基百科中的问答对,旨在促进阿拉伯语问答系统的研究和开发。主要特征如下:...
    packageimg
  • 推特灾害预测数据集TwitterDisasterPredictionDataset-ghanender

    2025年4月24日   

    推特灾害预测数据集TwitterDisasterPredictionDataset-ghanender 数据来源:互联网公开数据 标签:社交媒体,灾害预测,数据集,机器学习,自然语言处理,文本分类,数据挖掘,突发事件 数据概述: 该数据集包含来自推特(Twitter)平台的数据,记录了用户发布的与灾害相关的推文。主要特征如下:...
    packageimg
  • 音乐生成MIDI音符数据集MIDITokenizedDataset-shusrith

    2025年4月24日   

    音乐生成MIDI音符数据集MIDITokenizedDataset-shusrith 数据来源:互联网公开数据 标签:音乐生成,MIDI,数据集,自然语言处理,深度学习,音乐信息检索,序列建模,音频分析 数据概述: 该数据集包含了经过token化处理的MIDI音乐数据,旨在用于音乐生成模型的训练和评估。主要特征如下: 时间跨度:...
    packageimg
  • 文本分类训练数据集CorpusCategoriasTreino-brunocomitre

    2025年4月24日   

    文本分类训练数据集CorpusCategoriasTreino-brunocomitre 数据来源:互联网公开数据 标签:文本分类,数据集,机器学习,自然语言处理,分类任务,文本分析,葡萄牙语,训练集 数据概述: 该数据集包含了用于文本分类任务的葡萄牙语文本数据。主要特征如下: 时间跨度:数据未明确标注具体时间范围,但主要包含当代文本。...
    packageimg
  • 抑郁症分析数据集DepressionDataset-ahmedshaheen1999

    2025年4月24日   

    抑郁症分析数据集DepressionDataset-ahmedshaheen1999 数据来源:互联网公开数据 标签:抑郁症,心理健康,数据集,情绪分析,自然语言处理,文本挖掘,医学,社交媒体 数据概述:该数据集包含来自Dr. Shaheen的关于抑郁症的数据,记录了与抑郁症相关的文本信息。主要特征如下:...
    packageimg
  • 政府机构社交媒体数据分析数据集GovernmentOrganizationsSocialMediaDataAnalysisDataset-danielhain

    2025年4月24日   

    政府机构社交媒体数据分析数据集GovernmentOrganizationsSocialMediaDataAnalysisDataset-danielhain 数据来源:互联网公开数据 标签:社交媒体,政府机构,数据分析,文本挖掘,情感分析,舆情监测,公共管理,自然语言处理 数据概述:...
    packageimg
  • 政治评论文本情感分析数据集PoliticalCommentsSentimentAnalysisDataset-mdrahitazim

    2025年4月24日   

    政治评论文本情感分析数据集PoliticalCommentsSentimentAnalysisDataset-mdrahitazim 数据来源:互联网公开数据 标签:政治评论,情感分析,自然语言处理,数据集,文本挖掘,机器学习,舆情分析,社会科学 数据概述: 该数据集包含了来自互联网的政治评论文本数据,主要用于情感分析研究。主要特征如下: 时间跨度:...
    packageimg
  • 自然语言处理项目数据集NLPProjectDataset-chiraayupravin

    2025年4月24日   

    自然语言处理项目数据集NLPProjectDataset-chiraayupravin 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,语言模型,人工智能,数据挖掘,文本分类 数据概述: 该数据集为自然语言处理项目的一部分,主要记录了用于文本分析,语言模型训练等任务的数据。主要特征如下:...
    packageimg
  • HackerEarth零样本数据科学挑战赛数据集Zero-ShotDataScienceChallengeDataset-mark13juna

    2025年4月24日   

    HackerEarth零样本数据科学挑战赛数据集Zero-ShotDataScienceChallengeDataset-mark13juna 数据来源:互联网公开数据 标签:数据科学,零样本学习,文本分类,机器学习,自然语言处理,竞赛数据集,HackerEarth,NLP 数据概述:...
    packageimg
  • 英语-越南语双语平行文本数据集English-VietnameseParallelTextDataset-flightstar

    2025年4月24日   

    英语-越南语双语平行文本数据集English-VietnameseParallelTextDataset-flightstar 数据来源:互联网公开数据 标签:语言翻译,平行文本,数据集,自然语言处理,机器学习,双语研究,人工智能,语言技术 数据概述: 该数据集包含英语和越南语的双语平行文本,记录了两种语言之间的对应翻译关系。主要特征如下:...
    packageimg
  • Reddit社区评论文本与参数数据集-takeshiiijima

    2025年4月24日   

    Reddit社区评论文本与参数数据集-takeshiiijima 数据来源:互联网公开数据 标签:社交媒体,Reddit,评论,文本分析,自然语言处理,情感分析,机器学习,舆情分析 数据概述: 该数据集包含来自Reddit社区的评论数据,并附有相应的文本参数。主要特征如下: 时间跨度:数据记录的时间跨度未知,取决于Reddit公开数据的获取时间范围。...
    packageimg
  • JinaAI文本测试数据集JinaAITextTestDataset-xinrant

    2025年4月24日   

    JinaAI文本测试数据集JinaAITextTestDataset-xinrant 数据来源:互联网公开数据 标签:文本数据,数据集,自然语言处理,测试集,机器学习,Jina AI,NLP,评估 数据概述: 该数据集由Jina AI提供,用于测试和评估自然语言处理(NLP)模型和相关技术。主要特征如下:...
    packageimg
  • 缅甸新闻语料数据集MizoNews14kDataset-robzchhangte

    2025年4月24日   

    缅甸新闻语料数据集MizoNews14kDataset-robzchhangte 数据来源:互联网公开数据 标签:新闻数据,自然语言处理,文本分类,数据集,机器学习,新闻分析,缅甸语,语言技术 数据概述: 该数据集包含来自缅甸的新闻文本数据,记录了缅甸新闻媒体发布的各类新闻内容。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2020年。...
    packageimg
  • 自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg

    2025年4月24日   

    自然语言处理词袋模型提交数据集NLPBagofWordsSubmissionDataset-yashasgarg 数据来源:互联网公开数据 标签:自然语言处理,词袋模型,数据集,文本分类,机器学习,文本分析,数据挖掘,信息检索 数据概述: 该数据集包含自然语言处理中词袋模型的提交数据,记录了文本分类,关键词提取等任务的样本和标签。主要特征如下:...
    packageimg
  • 统计学专业毕业论文数据集数据集-tirtainovan

    2025年4月24日   

    统计学专业毕业论文数据集数据集-tirtainovan 数据来源:互联网公开数据 标签:统计学,毕业论文,数据集,文本分析,学术研究,自然语言处理,论文写作,学术资源 数据概述: 该数据集包含统计学专业毕业论文的文本数据,旨在为学术研究和数据分析提供支持。主要特征如下: 时间跨度:数据记录的时间范围涵盖了近年来统计学专业毕业论文。...
    packageimg
  • 新冠疫情问答数据集COVID-19QuestionAnsweringDataset-rockerritesh

    2025年4月24日   

    新冠疫情问答数据集COVID-19QuestionAnsweringDataset-rockerritesh 数据来源:互联网公开数据 标签:公共卫生,数据集,问答系统,自然语言处理,机器学习,疫情研究,人工智能,医疗信息 数据概述: 该数据集包含来自全球范围内关于新冠疫情的问答数据,记录了公众和专业人士就疫情相关问题与答案的详细信息。主要特征如下:...
    packageimg
  • 自然语言处理NLP最终项目数据集-prasadmagdum

    2025年4月24日   

    自然语言处理NLP最终项目数据集-prasadmagdum 数据来源:互联网公开数据 标签:自然语言处理,文本分析,数据集,机器学习,情感分析,文本分类,信息提取,深度学习 数据概述: 该数据集是为自然语言处理最终项目设计的,包含了多种文本数据,用于训练和评估各种NLP模型。主要特征如下: 时间跨度:数据记录的时间范围不固定,取决于各个子数据集的来源。...
    packageimg