找到5,810个数据集

标签: 文本分析

过滤结果
  • Reddit自嘲评论数据集RedditRoastMeSubredditCommentsDataset-cypherpunksamurai

    2025年4月24日   

    Reddit自嘲评论数据集RedditRoastMeSubredditCommentsDataset-cypherpunksamurai 数据来源:互联网公开数据 标签:社交媒体,文本分析,情感分析,自然语言处理,机器学习,心理学,网络文化,数据挖掘 数据概述:...
    packageimg
  • 光学字符识别文本块数据集OCRChunksDataset-harshithasudhakar

    2025年4月24日   

    光学字符识别文本块数据集OCRChunksDataset-harshithasudhakar 数据来源:互联网公开数据 标签:OCR,文本识别,数据集,图像处理,自然语言处理,计算机视觉,深度学习,文本分析 数据概述:该数据集包含从各种文档和图像中提取的文本块数据,用于光学字符识别(OCR)技术的训练和评估。主要特征如下:...
    packageimg
  • 恶意词汇与恶意URL数据集LexicalMaliciousURLsDataset-sethmdoty

    2025年4月24日   

    恶意词汇与恶意URL数据集LexicalMaliciousURLsDataset-sethmdoty 数据来源:互联网公开数据 标签:网络安全,恶意URL,数据集,文本分析,机器学习,数据挖掘,安全研究,网络威胁 数据概述:...
    packageimg
  • 聊天机器人对话数据集ChatbotDialogueDataset-vinitrajputt

    2025年4月24日   

    聊天机器人对话数据集ChatbotDialogueDataset-vinitrajputt 数据来源:互联网公开数据 标签:自然语言处理,对话系统,机器学习,数据集,人工智能,语义理解,文本分析,智能客服 数据概述: 该数据集包含来自公开聊天机器人平台的对话数据,记录了用户与聊天机器人之间的交互内容。主要特征如下:...
    packageimg
  • YouTube视频评论垃圾邮件识别数据集YouTubeSpam-NotSpamDataset-madhuragl

    2025年4月24日   

    YouTube视频评论垃圾邮件识别数据集YouTubeSpam-NotSpamDataset-madhuragl 数据来源:互联网公开数据 标签:垃圾邮件,YouTube,评论,文本分析,自然语言处理,机器学习,情感分析,数据挖掘 数据概述: 该数据集包含来自YouTube视频的评论数据,用于识别垃圾邮件评论。主要特征如下:...
    packageimg
  • 博客文章内容分析数据集BlogsDataset-subhranilmondal12

    2025年4月24日   

    博客文章内容分析数据集BlogsDataset-subhranilmondal12 数据来源:互联网公开数据 标签:博客,文本分析,自然语言处理,情感分析,社交媒体,数据集,内容挖掘,主题建模 数据概述: 该数据集包含了来自多个博客平台的大量文章内容,记录了不同作者撰写的博客文章。主要特征如下:...
    packageimg
  • 垃圾邮件与非垃圾邮件分类数据集Spam-HamEmailsClassificationDataset-rockinjas123

    2025年4月24日   

    垃圾邮件与非垃圾邮件分类数据集Spam-HamEmailsClassificationDataset-rockinjas123 数据来源:互联网公开数据 标签:邮件分类,数据集,垃圾邮件检测,自然语言处理,机器学习,文本分析,信息安全,数据挖掘 数据概述:...
    packageimg
  • 自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy

    2025年4月24日   

    自然语言处理实践竞赛数据集NLPinPracticeCompetitionDataset-e0xextazy 数据来源:互联网公开数据 标签:自然语言处理,NLP,文本分类,数据集,机器学习,竞赛,文本分析,人工智能 数据概述: 该数据集包含来自自然语言处理实践竞赛的数据,记录了用于文本分类任务的文本数据。主要特征如下:...
    packageimg
  • 丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m

    2025年4月24日   

    丹特里新闻网站数据采集数据集DataCrawlDantriSplittedDataset-ngh19m 数据来源:互联网公开数据 标签:新闻数据,数据采集,数据集,文本分析,自然语言处理,机器学习,信息提取,数据挖掘 数据概述: 该数据集包含来自越南丹特里新闻网站(Dantri)的数据,记录了该网站的新闻文章内容。主要特征如下:...
    packageimg
  • 作者身份特征分析训练与测试数据集AuthorProfilingTrain-TestDataset-adesatyawahana

    2025年4月24日   

    作者身份特征分析训练与测试数据集AuthorProfilingTrain-TestDataset-adesatyawahana 数据来源:互联网公开数据 标签:自然语言处理,文本分析,机器学习,身份识别,情感分析,社交网络,数据挖掘,情感计算 数据概述:...
    packageimg
  • 美国民主党候选人推文数据集DemocraticNationalCommitteeCandidatesTweetsDataset-sheikhhanif

    2025年4月24日   

    美国民主党候选人推文数据集DemocraticNationalCommitteeCandidatesTweetsDataset-sheikhhanif 数据来源:互联网公开数据 标签:政治,社交媒体,数据集,文本分析,情感分析,机器学习,选举研究,舆论分析 数据概述:...
    packageimg
  • 文本分类数据集TextClassificationDataset-albellna

    2025年4月24日   

    文本分类数据集TextClassificationDataset-albellna 数据来源:互联网公开数据 标签:文本分类,自然语言处理,数据集,机器学习,文本分析,信息检索,人工智能,语言模型 数据概述: 该数据集包含来自多个来源的文本数据,记录了不同类别文本的样本,适用于文本分类,情感分析等应用。主要特征如下:...
    packageimg
  • 酒店评论原始数据数据集-ztamnaja

    2025年4月24日   

    酒店评论原始数据数据集-ztamnaja 数据来源:互联网公开数据 标签:酒店,评论,文本分析,情感分析,自然语言处理,数据集,旅游,客户体验 数据概述: 该数据集包含来自不同来源的酒店评论数据,记录了客户对酒店的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围跨度不详,具体取决于原始数据来源。 地理范围:数据覆盖全球范围内的酒店。...
    packageimg
  • Goodreads图书推荐数据集-rohitganeshkar

    2025年4月24日   

    Goodreads图书推荐数据集-rohitganeshkar 数据来源:互联网公开数据 标签:图书推荐,数据集,自然语言处理,机器学习,推荐系统,文本分析,用户行为,书评 数据概述: 该数据集包含来自Goodreads网站的图书推荐数据,记录了用户对书籍的评价,评论及相关信息。主要特征如下:...
    packageimg
  • 自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369

    2025年4月24日   

    自然语言处理语言检测数据集LanguageDetectionNLPDataset-tharun369 数据来源:互联网公开数据 标签:自然语言处理,语言检测,数据集,文本分析,机器学习,文本分类,语言学,计算机科学 数据概述:该数据集包含来自多个来源的文本数据,用于自然语言处理中的语言检测任务。主要特征如下:...
    packageimg
  • 标签分析情感分类数据集LabelAnalysisSentimentClassificationDataset-swetasuman17

    2025年4月24日   

    标签分析情感分类数据集LabelAnalysisSentimentClassificationDataset-swetasuman17 数据来源:互联网公开数据 标签:标签分析,情感分类,数据集,自然语言处理,机器学习,文本分析,情感研究,数据分析 数据概述:该数据集包含来自互联网的文本数据,记录了用户对不同标签的情感反馈和评价。主要特征如下:...
    packageimg
  • 学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein

    2025年4月24日   

    学术会议论文数据集AcademicConferencesPapersDataset-igalbronshtein 数据来源:互联网公开数据 标签:学术会议,论文,数据集,自然语言处理,文本分析,信息检索,学术研究,机器学习 数据概述: 该数据集包含来自多个学术会议的论文数据,记录了会议论文的标题,摘要,关键词,作者信息等。主要特征如下:...
    packageimg
  • 灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh

    2025年4月24日   

    灾害推文预处理数据集DisasterTweetsPreprocessedDataset-vladyslavsh 数据来源:互联网公开数据 标签:灾害管理,社交网络,数据集,文本分析,机器学习,自然语言处理,危机响应,信息提取 数据概述:该数据集包含预处理过的推文数据,这些推文与自然灾害事件相关。主要特征如下:...
    packageimg
  • 苹果公司季度财报发布前后推文数据集-rajaanss

    2025年4月24日   

    苹果公司季度财报发布前后推文数据集-rajaanss 数据来源:互联网公开数据 标签:苹果公司,推文,社交媒体,情感分析,季度财报,股票市场,自然语言处理,文本分析 数据概述: 该数据集包含来自Twitter的推文数据,记录了在苹果公司发布季度财报前后一段时间内的推文内容。主要特征如下:...
    packageimg
  • Python推荐书籍数据集-divyasaxena930

    2025年4月24日   

    Python推荐书籍数据集-divyasaxena930 数据来源:互联网公开数据 标签:书籍推荐,Python,数据集,机器学习,自然语言处理,协同过滤,文本分析,数据挖掘 数据概述: 该数据集包含关于使用Python进行书籍推荐的信息,记录了用户对书籍的评价,书籍的详细信息以及推荐系统的相关数据。主要特征如下:...
    packageimg