找到3,864个数据集

标签: 文本分类

过滤结果
  • 自杀倾向文本分析数据集

    2025年4月15日   

    自杀倾向文本分析数据集 数据来源:互联网公开数据 标签:自杀倾向,社交媒体,自然语言处理,情感分析,心理健康,文本分类,Reddit,数据清洗 数据概述:...
    packageimg
  • 大英百科全书文章标题数据集

    2025年4月15日   

    大英百科全书文章标题数据集 数据来源:互联网公开数据 标签:大英百科全书,文章标题,科技,艺术,文本分类,NLP,文本分析 数据概述: 本数据集收录了大英百科全书中的“艺术与科技”类目下的文章标题,通过大英百科全书API创建。未来版本将增加其他文章类别。数据集为进行文本分类、自然语言处理(NLP)任务和文本分析提供了丰富的标题样本。 数据用途概述:...
    packageimg
  • 推特文本情感分析-种族歧视与非歧视推文分类数据集

    2025年4月15日   

    推特文本情感分析-种族歧视与非歧视推文分类数据集 数据来源:互联网公开数据 标签:推特,文本分析,情感分析,种族歧视,自然语言处理,社交媒体,文本分类,机器学习 数据概述: 本数据集包含推特推文数据,用于种族歧视与非种族歧视言论的分类研究。...
    packageimg
  • 土耳其钓鱼邮件数据集

    2025年4月15日   

    土耳其钓鱼邮件数据集 数据来源:互联网公开数据 标签:钓鱼邮件,合法邮件,土耳其,网络安全,机器学习,文本分类,自然语言处理,社会工程学 数据概述: 本数据集包含7,500多封土耳其的钓鱼邮件和合法邮件,是进行钓鱼检测、网络安全研究和自然语言处理研究的宝贵资源。数据集包含邮件的唯一标识符、主题、发件人地址、邮件内容和类别等信息,覆盖了广泛的邮件样本。...
    packageimg
  • 诗歌情感分析数据集

    2025年4月15日   

    诗歌情感分析数据集 数据来源:互联网公开数据 标签:诗歌,情感分析,文学研究,机器学习,自然语言处理,文本分类 数据概述:...
    packageimg
  • 德古拉与傲慢与偏见文本分类数据集

    2025年4月15日   

    德古拉与傲慢与偏见文本分类数据集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,NLP,文学作品,情感分析,语料库,句子级别 数据概述: 本数据集包含《德古拉》(Dracula)和《傲慢与偏见》(Pride and...
    packageimg
  • HP打印机客户评论数据集

    2025年4月15日   

    HP打印机客户评论数据集 数据来源:互联网公开数据 标签:HP打印机,客户评论,文本分类,情感分析,市场研究,产品改进,消费者反馈 数据概述: 本数据集包含HP打印机的客户评论及其相关属性,数据来源于多个渠道,涵盖了客户评论的文本内容以及其它相关信息。该数据集适用于文本分类和情感分析任务,为机器学习模型的训练和评估提供了坚实的基础。 数据用途概述:...
    packageimg
  • 越南餐饮评论情感分析数据集1963-2021

    2025年4月15日   

    越南餐饮评论情感分析数据集1963-2021 数据来源:互联网公开数据 标签:越南,餐饮评论,情感分析,机器学习,自然语言处理,文本分类,特征提取,推荐系统,跨语言分析 数据概述: 本数据集是两个现有数据集的整合和精选集合,即Taaaan和Vu Duc Thinh编写的《越南情感分析-Foody》以及Cฦฐฦกง Khuแบฅต...
    packageimg
  • 推特情感数据集

    2025年4月15日   

    推特情感数据集 数据来源:互联网公开数据 标签:推特,情感分析,社交媒体,用户意见,自然语言处理,文本分类,公众情绪 数据概述: 本数据集包含推特用户对某一话题或事件的意见表达,每条推文都经过标注,反映了用户的情感倾向(正面、负面或中性)。数据集旨在为情感分析研究提供样本数据,涵盖多样化的用户观点和情感表达。 数据用途概述:...
    packageimg
  • 原生与非原生英语数据集

    2025年4月15日   

    原生与非原生英语数据集 数据来源:互联网公开数据 标签:英语学习,语言分析,原生英语,非原生英语,NLP,句子检测,文本分类 数据概述:...
    packageimg
  • 阿尔巴尼亚假新闻语料库

    2025年4月15日   

    阿尔巴尼亚假新闻语料库 数据来源:互联网公开数据 标签:假新闻检测,自然语言处理,阿尔巴尼亚语,文本分类,数据研究,信息真实性评估,新闻传播学 数据概述: 本数据集源自研究论文《Albanian fake news...
    packageimg
  • 阿拉伯文新闻文本摘要数据集

    2025年4月15日   

    阿拉伯文新闻文本摘要数据集 数据来源:互联网公开数据 标签:阿拉伯语,新闻文本,文本摘要,数据集,自然语言处理,文本分类,机器学习 数据概述:...
    packageimg
  • 广告垃圾邮件数据集

    2025年4月15日   

    广告垃圾邮件数据集 数据来源:互联网公开数据 标签:广告邮件,垃圾邮件,文本分类,自然语言处理,网络安全, 数据概述:...
    packageimg
  • 说唱歌词NLP数据集

    2025年4月15日   

    说唱歌词NLP数据集 数据来源:互联网公开数据 标签:说唱,歌词,NLP,文本分析,文本预处理,文本分类,音乐分析 数据概述: 本数据集收录了来自11位不同艺术家的说唱歌词,包括Drake、J. Cole、Kendrick Lamar、Eminem、Nas、Skepta、Rapsody、Nicki...
    packageimg
  • 阿拉伯语新闻文本分类语料库

    2025年4月15日   

    阿拉伯语新闻文本分类语料库 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,机器学习,语料库 数据概述: 本数据集包含以阿拉伯语撰写的新闻文本,涵盖了9个不同的新闻类别,以CSV格式存储。数据集旨在为阿拉伯语新闻文本的分类任务提供支持,包含数万条新闻数据,每条数据均标注了具体的类别信息。 数据用途概述:...
    packageimg
  • 印度网民对科技产品情感分析数据集2021

    2025年4月15日   

    印度网民对科技产品情感分析数据集2021 数据来源:互联网公开数据 标签:情感分析,社交媒体分析,自然语言处理,消费者反馈,科技产品,印度,文本分类 数据概述:...
    packageimg
  • 推特情感分析竞赛伪标签推文数据集-2020年

    2025年4月15日   

    推特情感分析竞赛伪标签推文数据集-2020年 数据来源:互联网公开数据 标签:推特,情感分析,自然语言处理,伪标签,文本分类,竞赛,机器学习,社交媒体 数据概述:...
    packageimg
  • 星巴克评论数据集

    2025年4月15日   

    星巴克评论数据集 数据来源:互联网公开数据 标签:星巴克,评论,情感分析,自然语言处理,文本分类,数据清洗,商业分析 数据概述: 本数据集包含700条星巴克评论数据,涵盖5个字段:用户名称、位置、日期、评分和评论内容。评论内容为原始文本,未经过预处理。数据集旨在为自然语言处理任务提供基础数据支持,适用于情感分析、文本分类等场景。 数据用途概述:...
    packageimg
  • 基于文本的分类数据集

    2025年4月15日   

    基于文本的分类数据集 数据来源:互联网公开数据 标签:文本分类,区块链,机器学习,自然语言处理,数据标注,监督学习,领域特定文本 数据概述 本数据集旨在基于文本内容对样本进行分类,数据来源于区块链领域相关的文本资料。数据集包含两部分内容: -...
    packageimg
  • 英国广播公司BBC新闻文章文本分类数据集

    2025年4月15日   

    英国广播公司BBC新闻文章文本分类数据集 数据来源:互联网公开数据 标签:新闻文章,文本分类,自然语言处理,机器学习,BBC,媒体,文本数据,分类任务 数据概述:...
    packageimg