找到11,864个数据集

标签: 自然语言处理

过滤结果
  • 大型语言模型性能评测数据集MegformerMainDataset-sinamoradi

    2025年4月25日   

    大型语言模型性能评测数据集MegformerMainDataset-sinamoradi 数据来源:互联网公开数据 标签:自然语言处理,语言模型,数据集,模型评测,机器学习,深度学习,AI评估,技术优化 数据概述: 该数据集包含来自Megformer项目的测试数据,专门用于评估大型语言模型的性能。主要特征如下:...
    packageimg
  • 音乐评论与印尼语分析数据集ReviewSpotifyBahasaIndonesiaDataset-laodealvinrahmats

    2025年4月25日   

    音乐评论与印尼语分析数据集ReviewSpotifyBahasaIndonesiaDataset-laodealvinrahmats 数据来源:互联网公开数据 标签:音乐评论,印尼语,数据集,自然语言处理,情感分析,音乐推荐,机器学习,多语言处理 数据概述:...
    packageimg
  • 英语-泰卢固语机器翻译数据集English-TeluguMachineTranslationDataset-krizzna69

    2025年4月25日   

    英语-泰卢固语机器翻译数据集English-TeluguMachineTranslationDataset-krizzna69 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,语言对齐,英语,泰卢固语,文本转换,人工智能 数据概述: 该数据集包含英语和泰卢固语之间的平行文本数据,记录了两种语言之间的句子对应关系。主要特征如下:...
    packageimg
  • 音乐推荐与情感分析数据集MusicRecommendationandSentimentAnalysisDataset-habibaaaem505

    2025年4月25日   

    音乐推荐与情感分析数据集MusicRecommendationandSentimentAnalysisDataset-habibaaaem505 数据来源:互联网公开数据 标签:音乐推荐,情感分析,数据集,数据挖掘,自然语言处理,用户行为,机器学习,音频处理 数据概述:...
    packageimg
  • GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr

    2025年4月25日   

    GPT4再生成大模型数据集GPT4RephrasedLLMDAIGTDataset数据集-snassimr 数据来源:互联网公开数据 标签:自然语言处理,数据集,机器学习,文本生成,语言模型,人工智能,深度学习,文本分析 数据概述:该数据集包含了由GPT4再生成的语言模型数据,适用于自然语言处理,文本生成等任务。主要特征如下:...
    packageimg
  • 数据2021年全球unrest推特数据集AllDaysExtractedTweetsUnrest2021-liadperetz

    2025年4月25日   

    2021年全球unrest推特数据集AllDaysExtractedTweetsUnrest2021-liadperetz 数据来源:互联网公开数据 标签:推特数据,社会 unrest,数据集,社交媒体分析,情感分析,自然语言处理,社会研究,事件监测 数据概述: 该数据集包含2021年全球各地与社会...
    packageimg
  • 预训练标签数据集Pred-trainTagsDataset-ananyaajoshi

    2025年4月25日   

    预训练标签数据集Pred-trainTagsDataset-ananyaajoshi 数据来源:互联网公开数据 标签:预训练,标签,数据集,自然语言处理,文本分类,信息检索,机器学习,深度学习 数据概述: 该数据集包含了用于预训练的标签数据,旨在支持各种自然语言处理任务,例如文本分类,信息检索等。主要特征如下: 时间跨度:...
    packageimg
  • IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj

    2025年4月25日   

    IMDB电影评论情感分析数据集IMDBReviewsSentimentAnalysisDataset-sureshvj 数据来源:互联网公开数据 标签:电影评论,情感分析,数据集,自然语言处理,机器学习,文本分类,数据挖掘,人工智能 数据概述:...
    packageimg
  • 北方雄狮推文数据集NorthernlionTweetsDataset-luigi595

    2025年4月25日   

    北方雄狮推文数据集NorthernlionTweetsDataset-luigi595 数据来源:互联网公开数据 标签:推文,社交媒体,游戏,直播,数据集,文本分析,自然语言处理,社区研究 数据概述: 该数据集包含来自知名游戏主播北方雄狮(Northernlion)的推文数据,记录了其在Twitter上的公开推文内容。主要特征如下:...
    packageimg
  • 安倍晋三推特数据集AbeShinzoTweetsDataset-lazon282

    2025年4月25日   

    安倍晋三推特数据集AbeShinzoTweetsDataset-lazon282 数据来源:互联网公开数据 标签:推特数据,政治人物,社交媒体,文本分析,自然语言处理,舆情分析,日本政治,数据集 数据概述: 该数据集包含来自日本前首相安倍晋三的推特数据,记录了其在推特平台上发布的所有推文。主要特征如下:...
    packageimg
  • 知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry

    2025年4月25日   

    知识竞赛问答数据集Jeopardy-QuestionandAnswerDataset-mattjberry 数据来源:互联网公开数据 标签:知识竞赛,问答数据,数据集,自然语言处理,文本挖掘,机器学习,教育技术,信息检索 数据概述: 该数据集包含来自知识竞赛节目《Jeopardy!》的问答数据,记录了节目中提出的各类问题及其对应的答案。主要特征如下:...
    packageimg
  • 代码评审数据CodeReviewData-bulivington

    2025年4月25日   

    代码评审数据CodeReviewData-bulivington 数据来源:互联网公开数据 标签:代码评审,软件工程,数据集,机器学习,代码分析,软件质量,开发效率,自然语言处理 数据概述: 该数据集包含了来自代码评审过程的数据,记录了软件开发过程中代码变更,评审意见和相关指标。主要特征如下: 时间跨度:...
    packageimg
  • 俄罗斯诗歌数据集RussianPoetryDataset-mira318

    2025年4月25日   

    俄罗斯诗歌数据集RussianPoetryDataset-mira318 数据来源:互联网公开数据 标签:诗歌,文学,俄语,数据集,文本分析,自然语言处理,文化研究,语言学 数据概述: 该数据集包含来自俄罗斯的诗歌作品,收录了不同时期,不同作者的诗歌,旨在为研究俄罗斯文学和语言提供数据支持。主要特征如下:...
    packageimg
  • 罗马Urdu情感分析数据集RomanUrduSentimentalData-itsnobita

    2025年4月25日   

    罗马Urdu情感分析数据集RomanUrduSentimentalData-itsnobita 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本挖掘,机器学习,乌尔都语,计算机科学,社会科学 数据概述: 该数据集包含来自互联网和社交媒体的罗马转写 Urdu...
    packageimg
  • 摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany

    2025年4月25日   

    摩洛哥方言语言学研究数据集MoroccanDialectDataset-yassinemekrany 数据来源:互联网公开数据 标签:语言学,方言研究,数据集,语音识别,自然语言处理,非洲文化,机器学习,语言分析 数据概述: 该数据集包含来自摩洛哥的方言语音和文本数据,记录了摩洛哥方言的发音,词汇和语法特征。主要特征如下:...
    packageimg
  • 英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya

    2025年4月25日   

    英汉平行语料数据集English-to-HindiParallelDataset-kuldeepsingharya 数据来源:互联网公开数据 标签:机器翻译,自然语言处理,数据集,印地语,英语,平行语料,语言学,文本分析 数据概述: 该数据集包含了英语和印地语的平行文本数据,旨在用于机器翻译模型的训练和评估。主要特征如下:...
    packageimg
  • 圣经与摩门教经典数据集

    2025年4月25日   

    圣经与摩门教经典数据集 数据来源:互联网公开数据 标签:圣经,摩门教经典,文本嵌入,宗教研究,自然语言处理,文本挖掘,机器学习 数据概述: 本数据集包含了《圣经》(KJV版本)、《摩尔门经》、《教义和圣约》以及《珍珠经》的书籍、章节和经文内容。数据集近期更新,加入了基于Google genai嵌入模型(models/text-...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon

    2025年4月25日   

    垃圾邮件与非垃圾邮件分类数据集SpamvsNotSpamClassificationDataset-sajalshovon 数据来源:互联网公开数据 标签:电子邮件,垃圾邮件,数据集,文本分类,机器学习,自然语言处理,数据分析,信息安全 数据概述:...
    packageimg
  • BERT情感分析数据集BERTABSADataset-darrellcr

    2025年4月25日   

    BERT情感分析数据集BERTABSADataset-darrellcr 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,机器学习,文本挖掘,情感计算,人工智能,数据标注 数据概述: 该数据集包含用于BERT模型的情感分析任务的数据,记录了文本内容的情感极性。主要特征如下: 时间跨度:数据记录的时间范围不明确,主要为静态文本数据。...
    packageimg
  • 情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong

    2025年4月25日   

    情绪词汇提取数据集EmotionalWordExtractionDataset-luoshiyong 数据来源:互联网公开数据 标签:情绪词汇,数据集,自然语言处理,文本分析,情感计算,社会心理学,机器学习,语言学 数据概述: 该数据集包含来自多个来源的情绪词汇,记录了不同词汇对应的情绪类别及其相关特征。主要特征如下:...
    packageimg