找到4,369个数据集

标签: 文本分类

过滤结果
  • GitHub问题分类预测数据集

    2025年4月19日   

    GitHub问题分类预测数据集 数据来源:互联网公开数据 标签:GitHub, bug预测, 特性提取, 文本分类, NLP, 机器学习, 预训练模型 数据概述:...
    packageimg
  • 航空公司客户口碑评论数据集

    2025年4月19日   

    航空公司客户口碑评论数据集 数据来源:互联网公开数据 标签:航空公司,客户口碑,文本分类,评论分析,用户体验,消费者行为,情感分析 数据概述:...
    packageimg
  • 新闻真伪鉴别-印度新闻文章数据集2023-2024

    2025年4月19日   

    新闻真伪鉴别-印度新闻文章数据集2023-2024 数据来源:互联网公开数据 标签:假新闻,真新闻,新闻分析,文本分类,自然语言处理,印度,新闻报道,数据挖掘,信息可靠性 数据概述: 本数据集旨在用于新闻真伪鉴别研究,收录了来自印度不同新闻来源的文章。 数据集包含两类文章:一类来自如《印度时报》(Times of...
    packageimg
  • 电影评论情感预测数据集

    2025年4月19日   

    电影评论情感预测数据集 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,机器学习,自然语言处理,NLP,数据分析,电影元数据 数据概述:...
    packageimg
  • Jigsaw多语言有毒评论分类预处理数据集

    2025年4月19日   

    Jigsaw多语言有毒评论分类预处理数据集 数据来源:互联网公开数据 标签:自然语言处理,文本分类,有毒评论,多语言,预处理,机器学习,XLM-RoBERTa,Jigsaw 数据概述: 本数据集包含Jigsaw多语言有毒评论分类任务的预处理后的CSV文件。数据使用Hugging Face...
    packageimg
  • Steam游戏评论文本特征及用户偏好数据集-2023年

    2025年4月19日   

    Steam游戏评论文本特征及用户偏好数据集-2023年 数据来源:互联网公开数据 标签:Steam,游戏,评论,文本分析,用户偏好,机器学习,自然语言处理,推荐系统 数据概述:...
    packageimg
  • 塔斯尼姆新闻数据集

    2025年4月19日   

    塔斯尼姆新闻数据集 数据来源:互联网公开数据 标签:新闻分类,文本分类,媒体分析,自然语言处理,数据爬取 数据概述: 本数据集是从Tasnim新闻网站爬取的公开新闻数据,涵盖了多个类别的新闻内容。数据集旨在提供一个均衡分布的多类别新闻数据集,适用于文本分类任务。 数据用途概述:...
    packageimg
  • 荷兰新闻党派检测数据集

    2025年4月19日   

    荷兰新闻党派检测数据集 数据来源:互联网公开数据 标签:荷兰新闻,党派检测,文本分类,政治倾向,媒体分析 数据概述:...
    packageimg
  • 印度中部库尔德语电影评论情感分析数据集

    2025年4月19日   

    印度中部库尔德语电影评论情感分析数据集 数据来源:互联网公开数据 标签:库尔德语,电影评论,情感分析,自然语言处理,机器学习,文本分类 数据概述:...
    packageimg
  • AI生成与人类写作检测数据集

    2025年4月19日   

    AI生成与人类写作检测数据集 数据来源:互联网公开数据 标签:AI生成文本,人类写作,文本分类,自然语言处理,NLP,机器学习,生成式AI,数据集 数据概述...
    packageimg
  • Quora问答平台问题真伪分类训练数据集-2018

    2025年4月19日   

    Quora问答平台问题真伪分类训练数据集-2018 数据来源:互联网公开数据 标签:自然语言处理,文本分类,问答系统,Quora,机器学习,训练数据,问题真伪,情感分析 数据概述:...
    packageimg
  • 标题与头条情感预测数据集

    2025年4月18日   

    标题与头条情感预测数据集 数据来源:互联网公开数据 标签:情感分析, 社交媒体, 标题情感, 头条情感, 文本分类, 机器学习, 数据科学 数据概述:...
    packageimg
  • 土耳其自然语言推理数据集

    2025年4月18日   

    土耳其自然语言推理数据集 数据来源:互联网公开数据 标签:自然语言推理,土耳其语,NLI,机器学习,自然语言处理,文本分类,跨语言推理 数据概述: 本数据集包含两个子集(SNLI-TR和MNLI-...
    packageimg
  • 秘鲁美食评论数据集

    2025年4月18日   

    秘鲁美食评论数据集 数据来源:互联网公开数据 标签:秘鲁美食,餐厅评论,情感分析,文本分类,用户评价,地理分布,餐厅运营,消费者行为,自然语言处理 数据概述:...
    packageimg
  • 评论与变量数据集

    2025年4月18日   

    评论与变量数据集 数据来源:互联网公开数据 标签:评论,变量,文本分析,情感分析,自然语言处理,用户行为,产品评价 数据概述:...
    packageimg
  • 新闻真伪识别数据集-涵盖多种来源与真实新闻对比

    2025年4月18日   

    新闻真伪识别数据集-涵盖多种来源与真实新闻对比 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,真实新闻,文本分类,机器学习,自然语言处理,舆情分析 数据概述: 本数据集整合了来自不同来源的新闻文章,经过清洗和特征工程处理,用于新闻真伪识别研究。数据集包含新闻文本及其对应的标签,标签分为两类:0代表假新闻,1代表真实新闻。 数据用途概述:...
    packageimg
  • Kaggle反馈竞赛修正训练集-文本标注数据集

    2025年4月18日   

    Kaggle反馈竞赛修正训练集-文本标注数据集 数据来源:互联网公开数据 标签:文本分析,自然语言处理,标注数据,竞赛,反馈,文本纠错,机器学习,NLP 数据概述: 本数据集是针对Kaggle反馈竞赛(Feedback...
    packageimg
  • 自然语言处理新闻真伪识别数据集

    2025年4月18日   

    自然语言处理新闻真伪识别数据集 数据来源:互联网公开数据 标签:自然语言处理, 文本分类, 虚假新闻, 真实新闻, 新闻分析, 机器学习, 文本数据 数据概述: 本数据集包含用于新闻真伪识别的文本数据,主要用于自然语言处理(NLP)相关研究。...
    packageimg
  • GitHub问题预测挑战赛问题类型预测数据集

    2025年4月18日   

    GitHub问题预测挑战赛问题类型预测数据集 数据来源:互联网公开数据 标签:GitHub,问题预测,文本分类,自然语言处理,机器学习,代码缺陷,软件开发,NLP,BERT 数据概述:...
    packageimg
  • Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集

    2025年4月17日   

    Enron邮件数据集垃圾邮件与非垃圾邮件分类数据集 数据来源:互联网公开数据 标签:邮件,Enron,垃圾邮件,非垃圾邮件,文本分类,自然语言处理,数据清洗,邮件分析 数据概述:...
    packageimg