找到3,950个数据集

标签: 文本分类

过滤结果
  • COVID-19假新闻识别训练数据集-2021-gyuntian

    2025年4月22日   

    COVID-19假新闻识别训练数据集-2021-gyuntian 数据来源:互联网公开数据 标签:COVID-19,假新闻,数据集,机器学习,文本分类,训练数据,健康信息,开源数据 数据概述: 本数据集包含用于训练COVID-19假新闻识别模型的数据,来源包括Google...
    packageimg
  • 商业新闻文章分类数据集-多种商业事件-2024-arpytanshu

    2025年4月22日   

    商业新闻文章分类数据集-多种商业事件-2024-arpytanshu 数据来源:互联网公开数据 标签:商业新闻,文本分类,财经,新闻文章,产品,并购,盈利,劳工,法律,合作,投资 数据概述:...
    packageimg
  • 新闻文本分类预测数据集-gauravduttakiit

    2025年4月22日   

    新闻文本分类预测数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,多分类,新闻分类,文本分析 数据概述: 本数据集包含用于新闻文本分类任务的样本数据。 数据集由新闻标题和新闻正文片段组成,并为每条新闻分配了一个类别标签。 类别标签代表新闻的主题或类别,例如:体育、科技、政治、经济、娱乐等。...
    packageimg
  • 大规模文本数据集分析报告

    2025年4月22日   

    标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1....
    packageimg
  • 大规模文本分类数据集详述

    2025年4月22日   

    标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。...
    packageimg
  • 大规模文本分类数据集

    2025年4月22日   

    标题:大规模文本分类数据集 数据内容: 本数据集包含232074条独特的文本数据,每条文本都有对应的分类标签。数据集包含以下字段: - text:文本内容 - class:文本类别(2种不同值) 数据来源: 互联网公开数据 数据用途: 该数据集适用于多个行业的文本分类任务: - 人工智能行业:训练文本分类模型 - 大数据行业:进行文本挖掘和自然语言处理...
    packageimg
  • 英文电影字幕数据集

    2025年4月22日   

    英文电影字幕数据集 数据来源:互联网公开数据 标签:电影字幕,英文电影,自然语言处理,语言建模,情感分析,机器学习,文本分类 数据概述: 本数据集包含了多部英文电影的字幕内容,涵盖广泛的主题和类型。数据集中的字幕以文本形式呈现,记录了电影中的对话、背景音及其他音频信息,为自然语言处理和机器学习提供丰富的语料支持。 数据用途概述:...
    packageimg
  • 软件需求分类数据集-PURE-computerscience3

    2025年4月22日   

    软件需求分类数据集-PURE-computerscience3 数据来源:互联网公开数据 标签:软件需求,功能需求,非功能需求,数据分析,机器学习,文本分类,软件工程 数据概述:...
    packageimg
  • 迷你日常对话行为识别数据集-as3eem

    2025年4月22日   

    迷你日常对话行为识别数据集-as3eem 数据来源:互联网公开数据 标签:对话,行为识别,自然语言处理,NLU,文本分类,教育,训练集,测试集 数据概述: 本数据集是针对自然语言理解(NLU)任务而设计的一个小型、经过处理的Daily...
    packageimg
  • 孟加拉语新闻数据集

    2025年4月22日   

    孟加拉语新闻数据集 数据来源:互联网公开数据 标签:新闻文本,孟加拉语,文本分类,文本摘要,自然语言处理 数据概述:...
    packageimg
  • 俄罗斯文学作品文本数据集

    2025年4月22日   

    俄罗斯文学作品文本数据集 数据来源:互联网公开数据 标签:文学作品,俄罗斯文学,自然语言处理,文本分类,作者识别,机器学习,不平衡数据,文本分析 数据概述:...
    packageimg
  • 伊朗新闻评论情感分析数据集-Banamenevisan-ir-2023-mohammadbidkhori2003

    2025年4月22日   

    伊朗新闻评论情感分析数据集-Banamenevisan-ir-2023-mohammadbidkhori2003 数据来源:互联网公开数据 标签:情感分析,自然语言处理,波斯语,伊朗,新闻评论,文本分类,机器学习,深度学习 数据概述:...
    packageimg
  • 车辆保险客户反馈情感分析数据集-2023-stevemartin0

    2025年4月22日   

    车辆保险客户反馈情感分析数据集-2023-stevemartin0 数据来源:互联网公开数据 标签:车辆保险,客户反馈,情感分析,文本分类,NLP,自然语言处理,意见挖掘,客户服务,保险理赔,政策条款 数据概述:...
    packageimg
  • 文本分类问答数据集-2011年至2021年-thedevastator

    2025年4月22日   

    文本分类问答数据集-2011年至2021年-thedevastator 数据来源:互联网公开数据 标签:文本分类,问答系统,自然语言处理,机器学习,数据集,教育,研究 数据概述:...
    packageimg
  • 孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir

    2025年4月22日   

    孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir 数据来源:互联网公开数据 标签:虚假评论检测,孟加拉语,情感分析,自然语言处理,机器学习,文本分类,社交媒体,评论数据 数据概述:...
    packageimg
  • 英国广播公司新闻内容分类数据集-新闻内容-文本-分类-yousefkhalil0

    2025年4月22日   

    英国广播公司新闻内容分类数据集-新闻内容-文本-分类-yousefkhalil0 数据来源:互联网公开数据 标签:新闻,文本分类,英国广播公司,BBC,新闻内容,分类,商业,娱乐,政治,体育,科技 数据概述:...
    packageimg
  • 斯洛伐克虚假新闻检测数据集-2023年-matejkore

    2025年4月22日   

    斯洛伐克虚假新闻检测数据集-2023年-matejkore 数据来源:互联网公开数据 标签:虚假新闻,斯洛伐克,文本分类,数据集,教育,研究,机器学习,自然语言处理 数据概述:...
    packageimg
  • 钓鱼邮件与合法邮件数据集-人类与LLM生成邮件对比研究-2024-francescogreco97

    2025年4月22日   

    钓鱼邮件与合法邮件数据集-人类与LLM生成邮件对比研究-2024-francescogreco97 数据来源:互联网公开数据 标签:钓鱼邮件,合法邮件,LLM生成,人类生成,文本分类,网络安全,机器学习,邮件分析 数据概述:...
    packageimg
  • 新闻真伪辨别文本分类数据集-neupane9sujal

    2025年4月22日   

    新闻真伪辨别文本分类数据集-neupane9sujal 数据来源:互联网公开数据 标签:新闻,真伪,假新闻,文本分类,自然语言处理,机器学习,标题,文本,标签 数据概述: 本数据集包含新闻文章的标题、正文以及真伪标签,可用于进行假新闻检测任务。数据集旨在帮助初学者学习文本分类技术,了解如何利用机器学习模型识别新闻的真伪。 数据包含以下字段:...
    packageimg
  • 推特及互动指标分析数据集-2023年-paakhim10

    2025年4月21日   

    推特及互动指标分析数据集-2023年-paakhim10 数据来源:互联网公开数据 标签:推特,情感分析,垃圾信息检测,文本分类,趋势识别,推荐系统,探索性数据分析,地理信息,时间序列,用户互动 数据概述:...
    packageimg