找到11,858个数据集

标签: 自然语言处理

过滤结果
  • 新闻内容发布与传播数据集DelfiCleanedNewsContentandDistributionDataset-janphiliptpfer

    2025年4月25日   

    新闻内容发布与传播数据集DelfiCleanedNewsContentandDistributionDataset-janphiliptpfer 数据来源:互联网公开数据 标签:新闻分析,内容传播,数据集,媒体研究,自然语言处理,机器学习,信息传播,社会研究 数据概述:...
    packageimg
  • 简历命名实体识别数据集ResumeNERDataset-raj26000

    2025年4月25日   

    简历命名实体识别数据集ResumeNERDataset-raj26000 数据来源:互联网公开数据 标签:简历处理,命名实体识别,数据集,自然语言处理,文本分析,机器学习,人力资源,人才招聘 数据概述:该数据集包含来自多个来源的简历数据,主要用于命名实体识别任务,记录了简历中的关键信息。主要特征如下:...
    packageimg
  • Sibert情感分析数据集-thnhanvng

    2025年4月25日   

    Sibert情感分析数据集-thnhanvng 数据来源:互联网公开数据 标签:情感分析,数据集,文本分析,自然语言处理,NLP,情感分类,情绪识别,机器学习,社交媒体 数据概述: 该数据集包含了Sibert提供的用于情感分析的文本数据,记录了各种文本片段的情感倾向。主要特征如下: 时间跨度:数据记录的时间跨度不明确,主要关注文本内容的情感表达。...
    packageimg
  • 网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp

    2025年4月25日   

    网络欺凌数据集Tanglish网络欺凌数据集唐语版本-mrchamp 数据来源:互联网公开数据 标签:网络欺凌,数据集,社交媒体,文本分析,自然语言处理,机器学习,社会学,心理学 数据概述:该数据集由Tanglish项目提供,主要记录了社交媒体平台上的文本数据,用于研究和识别网络欺凌行为。主要特征如下:...
    packageimg
  • 方言数据集DialectDataDataset-kitashinwtf

    2025年4月25日   

    方言数据集DialectDataDataset-kitashinwtf 数据来源:互联网公开数据 标签:方言,语言学,数据集,语音识别,机器学习,自然语言处理,语言研究,文化研究 数据概述: 该数据集包含来自不同地区方言的语音和文本数据,记录了多种方言的发音,词汇和语法特征。主要特征如下: 时间跨度:数据记录的时间范围从近年到现代。...
    packageimg
  • 自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01

    2025年4月25日   

    自然语言处理新闻标题数据集ANLPHeadlinesDataset-divyessh01 数据来源:互联网公开数据 标签:自然语言处理,新闻标题,文本分析,机器学习,情感分析,文本摘要,数据集,语言模型 数据概述: 该数据集包含来自多个新闻来源的新闻标题数据,主要用于自然语言处理(NLP)相关的研究和应用。主要特征如下:...
    packageimg
  • 中文维基百科词向量模型训练数据集-文本语料-2023年

    2025年4月25日   

    中文维基百科词向量模型训练数据集-文本语料-2023年 数据来源:互联网公开数据 标签:自然语言处理, 词向量, word2vec, 文本语料, 中文, 维基百科, 机器学习, 深度学习, 训练数据 数据概述:...
    packageimg
  • 推特情感分析预处理数据集TwitterSentimentAnalysisPreprocessedDataset-nileshthonte

    2025年4月25日   

    推特情感分析预处理数据集TwitterSentimentAnalysisPreprocessedDataset-nileshthonte 数据来源:互联网公开数据 标签:情感分析,数据集,社交媒体,自然语言处理,机器学习,文本挖掘,情感计算,数据预处理 数据概述: 该数据集包含来自推特平台的用户文本数据,经过预处理用于情感分析任务。主要特征如下:...
    packageimg
  • Reddit社交媒体情感分析数据集RedditSentimentAnalysisDataset-chibuzokelechi

    2025年4月25日   

    Reddit社交媒体情感分析数据集RedditSentimentAnalysisDataset-chibuzokelechi 数据来源:互联网公开数据 标签:情感分析,社交媒体,数据集,自然语言处理,机器学习,文本挖掘,数据科学,社会科学 数据概述: 该数据集包含来自Reddit社交媒体平台的数据,记录了用户发布的内容及其对应的情感标签。主要特征如下:...
    packageimg
  • 数据2018年搜索引擎结果页面SERP航班数据数据集-putdejudomthai

    2025年4月25日   

    2018年搜索引擎结果页面SERP航班数据数据集-putdejudomthai 数据来源:互联网公开数据 标签:航班数据,SERP,搜索引擎,机票信息,自然语言处理,文本挖掘,数据分析,航空业 数据概述: 该数据集包含来自搜索引擎结果页面(SERP)的航班信息,记录了2018年期间各种航班的详细信息。主要特征如下:...
    packageimg
  • 俄罗斯美食菜谱向量数据集POVARENOK-RUVectorsDataset-alice6fox

    2025年4月25日   

    俄罗斯美食菜谱向量数据集POVARENOK-RUVectorsDataset-alice6fox 数据来源:互联网公开数据 标签:菜谱,向量数据,数据集,美食研究,机器学习,自然语言处理,烹饪,饮食文化 数据概述:...
    packageimg
  • YouTube印度最佳旅游目的地评论数据集-anjalichawda

    2025年4月25日   

    YouTube印度最佳旅游目的地评论数据集-anjalichawda 数据来源:互联网公开数据 标签:YouTube,评论数据,旅游,印度,文本分析,情感分析,自然语言处理,社交媒体 数据概述: 该数据集包含来自YouTube平台上关于印度最佳旅游目的地的评论数据,记录了用户对不同旅游目的地的评论内容。主要特征如下:...
    packageimg
  • 亚马逊手机产品评论数据集AmazonMobileProductReviewDataset-nehathakur28dec

    2025年4月25日   

    亚马逊手机产品评论数据集AmazonMobileProductReviewDataset-nehathakur28dec 数据来源:互联网公开数据 标签:电商评论,消费者行为,数据集,自然语言处理,情感分析,机器学习,文本挖掘,产品评价 数据概述: 该数据集包含来自亚马逊平台的手机产品用户评论数据,记录了消费者对手机产品的评价内容。主要特征如下:...
    packageimg
  • 印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje

    2025年4月25日   

    印尼期刊文本分类数据集IndonesianJournalTF-IDFNaiveBayesClassifierDataset-eremje 数据来源:互联网公开数据 标签:印尼期刊, 文本分类, 数据集, TF-IDF, 朴素贝叶斯, 机器学习, 自然语言处理, 学术研究...
    packageimg
  • 大模型系统性能评估数据集LMSYSGemmaOut-of-FoldDataset-rushali98

    2025年4月25日   

    大模型系统性能评估数据集LMSYSGemmaOut-of-FoldDataset-rushali98 数据来源:互联网公开数据 标签:大模型,性能评估,数据集,机器学习,深度学习,自然语言处理,模型优化,数据科学技术 数据概述:...
    packageimg
  • 前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24

    2025年4月25日   

    前1000条法律判决书转录文本数据集LJDataFirst1000Transcriptions-manishprajapati24 数据来源:互联网公开数据 标签:法律,判决书,转录文本,自然语言处理,文本分析,数据集,机器学习,司法 数据概述: 该数据集包含前1000条法律判决书的转录文本数据,主要记录了司法判决的详细内容。主要特征如下:...
    packageimg
  • 童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari

    2025年4月25日   

    童话故事文本分析数据集Fairy-taleDataset-hrishabhtiwari 数据来源:互联网公开数据 标签:童话故事,文本分析,数据集,自然语言处理,文学研究,机器学习,故事分析,叙事学 数据概述: 该数据集包含来自多个来源的童话故事文本数据,记录了各类经典童话故事的完整内容和相关元数据。主要特征如下:...
    packageimg
  • 阿拉伯语讽刺文本数据集-farisalahmdi

    2025年4月25日   

    阿拉伯语讽刺文本数据集-farisalahmdi 数据来源:互联网公开数据 标签:阿拉伯语,讽刺,文本分析,自然语言处理,情感分析,语言学,机器学习,社交媒体 数据概述:该数据集包含了阿拉伯语的讽刺文本数据,主要来源于社交媒体平台,新闻网站等。主要特征如下: 时间跨度:数据记录的时间范围跨度不固定,取决于数据来源。...
    packageimg
  • 谣言评估数据集UpdatedRumourEvalDataset-latapangtey4

    2025年4月25日   

    谣言评估数据集UpdatedRumourEvalDataset-latapangtey4 数据来源:互联网公开数据 标签:谣言评估,社交媒体,数据集,自然语言处理,机器学习,信息传播,社会媒体分析,文本分类 数据概述: 该数据集包含更新后的谣言评估数据,记录了社交媒体平台上关于特定事件的谣言和非谣言帖子。主要特征如下:...
    packageimg
  • Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv

    2025年4月25日   

    Reddit社区图书讨论数据集Book-from-RedditDataset-vaishnavibv 数据来源:互联网公开数据 标签:图书,社区讨论,数据集,社交网络,文本分析,用户行为,自然语言处理,情感分析 数据概述: 该数据集包含来自Reddit平台的图书相关讨论数据,记录了用户在图书主题社区中的互动内容。主要特征如下:...
    packageimg