找到4,369个数据集

标签: 文本分类

过滤结果
  • 商业新闻文章分类数据集-多种商业事件-2024-arpytanshu

    2025年4月22日   

    商业新闻文章分类数据集-多种商业事件-2024-arpytanshu 数据来源:互联网公开数据 标签:商业新闻,文本分类,财经,新闻文章,产品,并购,盈利,劳工,法律,合作,投资 数据概述:...
    packageimg
  • 新闻文本分类预测数据集-gauravduttakiit

    2025年4月22日   

    新闻文本分类预测数据集-gauravduttakiit 数据来源:互联网公开数据 标签:新闻,文本分类,机器学习,自然语言处理,多分类,新闻分类,文本分析 数据概述: 本数据集包含用于新闻文本分类任务的样本数据。 数据集由新闻标题和新闻正文片段组成,并为每条新闻分配了一个类别标签。 类别标签代表新闻的主题或类别,例如:体育、科技、政治、经济、娱乐等。...
    packageimg
  • 大规模文本数据集分析报告

    2025年4月22日   

    标题:大规模文本数据集分析报告 数据内容: 该数据集包含两个主要字段: 1. text:包含487,235种不同的文本值,覆盖了广泛的文本内容,可能是从互联网公开数据中提取的。 2. generated:包含2种不同的值,可能是二元分类字段(例如,"是"或"否"),用于标识文本是否为生成内容。 数据来源:互联网公开数据 数据用途: 1....
    packageimg
  • 大规模文本分类数据集详述

    2025年4月22日   

    标题:大规模文本分类数据集详述 数据内容:该数据集包含了三个主要的数据元素,分别是评论内容(clean_comment)、文本内容(clean_text)和分类标签(category)。其中,评论内容有36,801种不同的值,文本内容有162,977种不同的值,分类标签有3种不同的值。数据集整体规模较大,适合用于文本分类、情感分析等任务。...
    packageimg
  • 大规模文本分类数据集

    2025年4月22日   

    标题:大规模文本分类数据集 数据内容: 本数据集包含232074条独特的文本数据,每条文本都有对应的分类标签。数据集包含以下字段: - text:文本内容 - class:文本类别(2种不同值) 数据来源: 互联网公开数据 数据用途: 该数据集适用于多个行业的文本分类任务: - 人工智能行业:训练文本分类模型 - 大数据行业:进行文本挖掘和自然语言处理...
    packageimg
  • 英文电影字幕数据集

    2025年4月22日   

    英文电影字幕数据集 数据来源:互联网公开数据 标签:电影字幕,英文电影,自然语言处理,语言建模,情感分析,机器学习,文本分类 数据概述: 本数据集包含了多部英文电影的字幕内容,涵盖广泛的主题和类型。数据集中的字幕以文本形式呈现,记录了电影中的对话、背景音及其他音频信息,为自然语言处理和机器学习提供丰富的语料支持。 数据用途概述:...
    packageimg
  • 软件需求分类数据集-PURE-computerscience3

    2025年4月22日   

    软件需求分类数据集-PURE-computerscience3 数据来源:互联网公开数据 标签:软件需求,功能需求,非功能需求,数据分析,机器学习,文本分类,软件工程 数据概述:...
    packageimg
  • 迷你日常对话行为识别数据集-as3eem

    2025年4月22日   

    迷你日常对话行为识别数据集-as3eem 数据来源:互联网公开数据 标签:对话,行为识别,自然语言处理,NLU,文本分类,教育,训练集,测试集 数据概述: 本数据集是针对自然语言理解(NLU)任务而设计的一个小型、经过处理的Daily...
    packageimg
  • 孟加拉语新闻数据集

    2025年4月22日   

    孟加拉语新闻数据集 数据来源:互联网公开数据 标签:新闻文本,孟加拉语,文本分类,文本摘要,自然语言处理 数据概述:...
    packageimg
  • 阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas

    2025年4月22日   

    阿萨姆语新闻文章数据集-新闻标题与正文-新闻18-东北现在--krishnabhdas 数据来源:互联网公开数据 标签:阿萨姆语,新闻,文章,标题,正文,新闻18,东北现在,文本数据,自然语言处理,NLP 数据概述:...
    packageimg
  • 俄罗斯文学作品文本数据集

    2025年4月22日   

    俄罗斯文学作品文本数据集 数据来源:互联网公开数据 标签:文学作品,俄罗斯文学,自然语言处理,文本分类,作者识别,机器学习,不平衡数据,文本分析 数据概述:...
    packageimg
  • 伊朗新闻评论情感分析数据集-Banamenevisan-ir-2023-mohammadbidkhori2003

    2025年4月22日   

    伊朗新闻评论情感分析数据集-Banamenevisan-ir-2023-mohammadbidkhori2003 数据来源:互联网公开数据 标签:情感分析,自然语言处理,波斯语,伊朗,新闻评论,文本分类,机器学习,深度学习 数据概述:...
    packageimg
  • 车辆保险客户反馈情感分析数据集-2023-stevemartin0

    2025年4月22日   

    车辆保险客户反馈情感分析数据集-2023-stevemartin0 数据来源:互联网公开数据 标签:车辆保险,客户反馈,情感分析,文本分类,NLP,自然语言处理,意见挖掘,客户服务,保险理赔,政策条款 数据概述:...
    packageimg
  • 文本分类问答数据集-2011年至2021年-thedevastator

    2025年4月22日   

    文本分类问答数据集-2011年至2021年-thedevastator 数据来源:互联网公开数据 标签:文本分类,问答系统,自然语言处理,机器学习,数据集,教育,研究 数据概述:...
    packageimg
  • 孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir

    2025年4月22日   

    孟加拉语虚假评论检测数据集BFRD-食品评论-2024-shawontanvir 数据来源:互联网公开数据 标签:虚假评论检测,孟加拉语,情感分析,自然语言处理,机器学习,文本分类,社交媒体,评论数据 数据概述:...
    packageimg
  • 高质量推特文本数据集-2023-mskorski

    2025年4月22日   

    高质量推特文本数据集-2023-mskorski 数据来源:互联网公开数据 标签:推特,社交媒体,文本数据,机器学习,主题提取,数据集,自然语言处理 数据概述: 本数据集包含6000条高质量的原始推特文本,这些推特最初由Khuyen...
    packageimg
  • 伊朗电影数据集-2021年-mohammad26845

    2025年4月22日   

    伊朗电影数据集-2021年-mohammad26845 数据来源:互联网公开数据 标签:伊朗电影,波斯语,机器学习,情感分析,自然语言处理,数据集 数据概述:...
    packageimg
  • 英国广播公司新闻内容分类数据集-新闻内容-文本-分类-yousefkhalil0

    2025年4月22日   

    英国广播公司新闻内容分类数据集-新闻内容-文本-分类-yousefkhalil0 数据来源:互联网公开数据 标签:新闻,文本分类,英国广播公司,BBC,新闻内容,分类,商业,娱乐,政治,体育,科技 数据概述:...
    packageimg
  • 斯洛伐克虚假新闻检测数据集-2023年-matejkore

    2025年4月22日   

    斯洛伐克虚假新闻检测数据集-2023年-matejkore 数据来源:互联网公开数据 标签:虚假新闻,斯洛伐克,文本分类,数据集,教育,研究,机器学习,自然语言处理 数据概述:...
    packageimg
  • 维基百科电影剧情描述去名数据集-abbrivia

    2025年4月22日   

    维基百科电影剧情描述去名数据集-abbrivia 数据来源:互联网公开数据 标签:电影,剧情,自然语言处理,主题建模,停用词,名字识别,维基百科 数据概述: 本数据集包含从维基百科抓取的35,000部电影的剧情描述,并移除了其中的所有名字。数据集通过内置的命名实体识别(NER)技术生成,并经过hunspell...
    packageimg