找到3,950个数据集

标签: 文本分类

过滤结果
  • 虚假新闻识别-ISOT虚假新闻数据集-islamic

    2025年4月21日   

    虚假新闻识别-ISOT虚假新闻数据集-islamic 数据来源:互联网公开数据 标签:虚假新闻, 真实新闻, 新闻文章, 文本分类, 自然语言处理, 政治新闻, 世界新闻, 数据集, 文本分析 数据概述:...
    packageimg
  • 抑郁症分类数据集-2022-vhonghoavin

    2025年4月21日   

    抑郁症分类数据集-2022-vhonghoavin 数据来源:互联网公开数据 标签:抑郁症,情感分析,自然语言处理,机器学习,心理健康,数据预处理,文本分类 数据概述: 本数据集源自DepSign-LT-...
    packageimg
  • 自然语言处理-职业意图项目数据集

    2025年4月21日   

    自然语言处理-职业意图项目数据集 数据来源:互联网公开数据 标签:自然语言处理,职业意图,文本分类,模型训练,数据集,机器学习,深度学习 数据概述:...
    packageimg
  • 航空安全报告文本分类数据集

    2025年4月21日   

    航空安全报告文本分类数据集 数据来源:互联网公开数据 标签:航空安全, 文本分类, 事件分析, 问题类型, 飞行事故, 数据挖掘, 机器学习 数据概述...
    packageimg
  • 虚假新闻识别文本数据集

    2025年4月21日   

    虚假新闻识别文本数据集 数据来源:互联网公开数据 标签:虚假新闻,新闻文本,自然语言处理,文本分类,机器学习,舆情分析,新闻真伪,网络安全 数据概述: 本数据集来源于《机器学习在网络安全中的应用》一书的第四章,包含了虚假新闻和真实新闻文章的集合。数据集旨在为研究人员和实践者提供一个用于虚假新闻检测和分析的资源。 数据用途概述:...
    packageimg
  • 英文小说文本数据集

    2025年4月21日   

    英文小说文本数据集 数据来源:互联网公开数据 标签:英文小说,自然语言处理,NLP,文本分类,文本摘要,文学作品,预处理,内容过滤 数据概述: 本数据集包含一系列英文小说文本,适用于自然语言处理(NLP)任务,例如文本分类、文本摘要等。数据集基于Project...
    packageimg
  • IMDB电影评论情感分析数据集-电影评论情感分类预测

    2025年4月21日   

    IMDB电影评论情感分析数据集-电影评论情感分类预测 数据来源:互联网公开数据 标签:电影评论,情感分析,自然语言处理,文本分类,机器学习,IMDB,情感,评论,文本数据 数据概述:...
    packageimg
  • SuperGLUE自然语言理解任务基准数据集

    2025年4月20日   

    SuperGLUE自然语言理解任务基准数据集 数据来源:互联网公开数据 标签:自然语言处理, NLP, 语言理解, 文本分类, 问答, 语义推理, 多任务学习 数据概述: SuperGLUE 是一个由多个具有挑战性的自然语言理解(NLU)任务组成的数据集,旨在评估模型的泛化能力和对复杂语言现象的理解程度。该基准测试是 GLUE(General...
    packageimg
  • 序列分类数据集

    2025年4月20日   

    序列分类数据集 数据来源:互联网公开数据 标签:序列分类,多分类任务,文本分类,自然语言处理,机器学习,小语言模型,数据标注,分类模型,分类任务 数据概述:...
    packageimg
  • 科幻与奇幻主题标签分类数据集

    2025年4月20日   

    科幻与奇幻主题标签分类数据集 数据来源:互联网公开数据 标签:科幻, 幻想, 标签分类, 多标签分类, 数据挖掘, 文本分类, 主题分析 数据概述...
    packageimg
  • 新闻真伪识别数据集-文本内容与标签-训练与测试集

    2025年4月20日   

    新闻真伪识别数据集-文本内容与标签-训练与测试集 数据来源:互联网公开数据 标签:假新闻检测,文本分类,自然语言处理,机器学习,新闻,真伪,文本分析 数据概述: 本数据集旨在支持假新闻检测的研究与开发,包含用于训练、测试模型的数据。数据集由三个CSV文件构成: 1....
    packageimg
  • Jigsaw毒性评论多语言分类数据集

    2025年4月20日   

    Jigsaw毒性评论多语言分类数据集 数据来源:互联网公开数据 标签:文本分类, 毒性检测, 自然语言处理, 多语言, 评论, 社交媒体, 文本分析, 机器学习 数据概述: 本数据集由Pavel Ostyakov创建,旨在支持多语言环境下的毒性评论分类任务。 数据集包含了多种语言的文本评论,并标注了毒性标签。...
    packageimg
  • 股票市场推文情感数据集

    2025年4月20日   

    股票市场推文情感数据集 数据来源:互联网公开数据 标签:股票市场,情感分析,自然语言处理,推文数据,投资决策,金融分析,文本分类 数据概述:...
    packageimg
  • 五十位维多利亚时代小说家的作者归属数据集

    2025年4月20日   

    五十位维多利亚时代小说家的作者归属数据集 数据来源:互联网公开数据 标签:小说,文学分析,作者归属,文本挖掘,维多利亚时代,自然语言处理,文学研究,文本分类 数据概述:...
    packageimg
  • 酒店评论情感分析数据集

    2025年4月20日   

    酒店评论情感分析数据集 数据来源:互联网公开数据 标签:酒店评论,情感分析,文本分类,机器学习,自然语言处理,情感极性,TF-IDF,词向量,深度学习 数据概述:...
    packageimg
  • Jigsaw毒性评论标注数据集-评论毒性评估与分析

    2025年4月20日   

    Jigsaw毒性评论标注数据集-评论毒性评估与分析 数据来源:互联网公开数据 标签:毒性评论,自然语言处理,文本分类,情感分析,仇恨言论,冒犯性语言,标注数据,社交媒体,机器学习 数据概述:...
    packageimg
  • 阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用

    2025年4月20日   

    阿拉伯语增强型开放海豚数据集-用于自动化作文评分-多语言应用 数据来源:互联网公开数据 标签:阿拉伯语,作文评分,自然语言处理,机器学习,数据集,文本分类,多语言,Open Orca, GPT-3.5, GPT-4, RAG, 翻译 数据概述:...
    packageimg
  • 检测LLM生成文本数据集

    2025年4月20日   

    检测LLM生成文本数据集 数据来源:互联网公开数据 标签:LLM,生成文本检测,文本分类,自然语言处理,数据集合并,文本生成评估 数据概述: 本数据集是一个整合了多个数据集的综合集合,主要用于“LLM - Detect AI Generated...
    packageimg
  • 标准对话日志数据集

    2025年4月19日   

    标准对话日志数据集 数据来源:互联网公开数据 标签:对话日志,自然语言处理,机器学习,聊天机器人,情感分析,文本分类,对话分析,OpenAI 数据概述:...
    packageimg
  • 多语言情感分析数据集

    2025年4月19日   

    多语言情感分析数据集 数据来源:互联网公开数据 标签:情感分析,自然语言处理,多语言模型,文本分类,LLM生成,数据清洗 数据概述:...
    packageimg