找到4,514个数据集

标签: 文本分类

过滤结果
  • 印度板球评论分析数据集1963-2021

    2025年4月14日   

    印度板球评论分析数据集1963-2021 数据来源:互联网公开数据 标签:板球,评论分析,自然语言处理,文本分类,情感分析,机器学习 数据概述: 本数据集是一个强大的工具,用于理解和分析板球比赛中的评论。数据集包括三个部分:Validation.csv、Train.csv 和...
    packageimg
  • IMDB电影剧集情节摘要文本分类数据集

    2025年4月14日   

    IMDB电影剧集情节摘要文本分类数据集 数据来源:互联网公开数据 标签:IMDB, 电影, 文本分类, 机器学习, 自然语言处理, 类别识别 数据概述: 本数据集包含 1000 条来自 IMDB(Internet Movie Database)的电影/电视剧剧情概要,涵盖 4...
    packageimg
  • 印度短信垃圾信息检测数据集1963-2021

    2025年4月14日   

    印度短信垃圾信息检测数据集1963-2021 数据来源:互联网公开数据 标签:短信,垃圾信息检测,文本分类,机器学习,自然语言处理 数据概述:...
    packageimg
  • Reddit用户抑郁症讨论文本数据集

    2025年4月14日   

    Reddit用户抑郁症讨论文本数据集 数据来源:互联网公开数据 标签:Reddit,抑郁症,文本数据,情感分析,机器学习,心理健康,社交媒体,数据挖掘 数据概述: 本数据集来源于Reddit平台,由私人在一项使用机器学习技术检测抑郁症的广泛研究项目中整理。 数据通过数据挖掘的方式获取,并经过了简单的数据清洗,以提高数据质量。...
    packageimg
  • 尼泊尔语情感分析数据集

    2025年4月14日   

    尼泊尔语情感分析数据集 数据来源:互联网公开数据 标签:尼泊尔语,情感分析,自然语言处理,文本分类,社交媒体分析,机器学习 数据概述:...
    packageimg
  • 库尔德语假新闻数据集

    2025年4月14日   

    库尔德语假新闻数据集 数据来源:互联网公开数据 标签:假新闻检测,库尔德语,NLP,文本分类,新闻真实性,社交媒体内容,数据集 数据概述:...
    packageimg
  • 生成电子邮件垃圾邮件数据集

    2025年4月14日   

    生成电子邮件垃圾邮件数据集 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分类,机器学习,数据标注,合成数据,网络安全,文本数据,NLP,情感分析 数据概述: 本数据集包含一个CSV文件,该文件包含300条生成的电子邮件垃圾邮件消息。每个文件行代表一封单独的电子邮件,包括其标题和正文。该数据集旨在促进垃圾邮件电子邮件的分析和检测。...
    packageimg
  • 性别偏见西班牙语数据集

    2025年4月14日   

    性别偏见西班牙语数据集 数据来源:互联网公开数据 标签:性别偏见,社交媒体分析,西班牙语,文本分类,数据标注,网络偏见,社会研究 数据概述: 本数据集包含超过1900条标注为有偏见或无偏见的西班牙语推文。这些数据是为减少互联网上性别偏见的黑客马拉松活动特别收集和标注的,旨在帮助识别和分析社交媒体中的性别偏见问题。 数据用途概述:...
    packageimg
  • 模拟城市-建造App用户评论情感分析数据集

    2025年4月14日   

    模拟城市-建造App用户评论情感分析数据集 数据来源:互联网公开数据 标签:App评论,情感分析,用户反馈,模拟城市,游戏,Google Play,自然语言处理,文本分析,用户体验 数据概述: 本数据集收录了来自Google Play商店中模拟城市:建造(SimCity...
    packageimg
  • 机器学习奥林匹克竞赛-葡萄牙语有毒语言检测扩展数据集

    2025年4月14日   

    机器学习奥林匹克竞赛-葡萄牙语有毒语言检测扩展数据集 数据来源:互联网公开数据 标签:机器学习,自然语言处理,文本分类,有毒语言,葡萄牙语,社交媒体,情感分析,文本清洗 数据概述:...
    packageimg
  • 电子商务文本分类数据集

    2025年4月14日   

    电子商务文本分类数据集 数据来源:互联网公开数据 标签:电子商务,文本分类,产品描述,商品类别,电子设备,家居用品,书籍,服装与配饰 数据概述: 本数据集是一个基于电子商务文本的分类数据集,包含四个主要类别:电子设备(Electronics)、家居用品(Household)、书籍(Books) 和 服装与配饰(Clothing &...
    packageimg
  • 数据1000个故事100个题材数据集

    2025年4月14日   

    数据1000个故事100个题材数据集 数据来源:互联网公开数据 标签:故事,题材,文本分析,自然语言处理,文本分类,文学研究 数据概述:...
    packageimg
  • FACENS自然语言处理分类训练数据集

    2025年4月14日   

    FACENS自然语言处理分类训练数据集 数据来源:互联网公开数据 标签:自然语言处理,分类,训练数据,文本分析,FACENS,数据科学 数据概述:...
    packageimg
  • 土耳其新闻文本数据集

    2025年4月14日   

    土耳其新闻文本数据集 数据来源:互联网公开数据 标签:土耳其新闻,文本分析,新闻分类,文化,艺术,经济,世界新闻,汽车,体育,技术,杂志 数据概述:...
    packageimg
  • 西班牙语推文情感分析数据集

    2025年4月14日   

    西班牙语推文情感分析数据集 数据来源:互联网公开数据 标签:情感分析,西班牙语,社交媒体,自然语言处理,文本分类,情感识别 数据概述: 本数据集旨在支持西班牙语情感分析模型的开发,包含西班牙语推文的文本内容及其对应的情感标签。数据集记录了每条推文的发布时间和主题标签,适用于分析西班牙语社交媒体中的情感倾向。 数据用途概述:...
    packageimg
  • 情感数据集原始版

    2025年4月14日   

    情感数据集原始版 数据来源:互联网公开数据 标签:情感分析,自然语言处理,NLP,情感检测,文本分类,机器学习,聊天机器人,推荐系统,心理健康 数据概述:...
    packageimg
  • 洋葱新闻数据集

    2025年4月14日   

    洋葱新闻数据集 数据来源:互联网公开数据 标签:洋葱新闻,真实新闻,文本分类,机器学习,自然语言处理,数据集,新闻真实性 数据概述: 本数据集包含《The Onion》发布的假新闻文章和来自Reddit论坛r/NotTheOnion的真实“洋葱式”新闻文章。《The...
    packageimg
  • Vox今日解读播客节目文本数据集

    2025年4月14日   

    Vox今日解读播客节目文本数据集 数据来源:互联网公开数据 标签:播客,文本,新闻,时事,舆情分析,对话,VOX,Today Explained,转录 数据概述: 本数据集包含了Vox公司旗下播客节目“Today...
    packageimg
  • 语言检测数据集

    2025年4月14日   

    语言检测数据集 数据来源:互联网公开数据 标签:语言检测,文本分类,社交媒体分析,推特数据,多语言处理 数据概述: 本数据集包含收集自2021年至2022年间推特上特定话题标签的推文数据,涵盖英语、法语和摩洛哥方言达里贾三种语言。数据集共包含约420行每种语言的数据,总计13153行,每行数据包括两个列:推文内容和对应的标签。 数据用途概述:...
    packageimg
  • 中东地区出行平台用户评论数据集

    2025年4月14日   

    中东地区出行平台用户评论数据集 数据来源: 互联网公开数据 (Google Play Store & Apple App Store) 标签: 用户评论,评论数据,自然语言处理,NLP,情感分析,出行平台 数据概述:...
    packageimg