找到3,862个数据集

标签: 文本分类

过滤结果
  • 越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset

    2025年6月23日   

    越南语情感分析文本数据集_Vietnamese_Sentiment_Analysis_Text_Dataset 数据来源:互联网公开数据 标签:情感分析, 文本分类, 越南语, 自然语言处理, 机器学习, 情感极性, 语料库, 深度学习 数据概述: 该数据集包含来自越南社交媒体平台的用户评论文本,用于进行情感分析。主要特征如下:...
    packageimg
  • 企业邮件垃圾分类样本数据集

    2025年6月19日   

    数据来源: 该数据集由美国能源公司 Enron 的内部通信记录构成,原始数据整理自 Enron Email Dataset,后经分类标注为“垃圾邮件”与“正常邮件”(Spam/Ham)两类,用于自然语言处理任务中的文本分类研究。 字段定义: Message ID:邮件编号,唯一标识每封邮件 Subject:邮件主题 Message:邮件正文内容...
    packageimg
  • COVID-19新闻数据集

    2025年6月4日   

    COVID-19新闻数据集 数据来源:互联网公开数据 标签:新闻数据,COVID-19,文本分类,自然语言处理,机器学习,疫情分析,信息抽取 数据概述:...
    packageimg
  • 俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov

    2025年6月4日   

    俄语社交媒体短文本情感分析与毒性检测数据集-RuTweetCorp-2012-maximsuvorov 数据来源:互联网公开数据 标签:俄语,社交媒体,短文本,情感分析,毒性检测,文本分类,自然语言处理,机器学习,RuTweetCorp 数据概述: 本数据集源自论文《Рубцова Ю. Автоматическое построение и...
    packageimg
  • 德国政客党派归属预测数据集

    2025年6月4日   

    德国政客党派归属预测数据集 数据来源:互联网公开数据 标签:德国政客,社交媒体分析,自然语言处理,政治倾向,机器学习,文本分类 数据概述: 本数据集基于对德国政客的Twitter数据进行收集和整理,包含了几乎全部德国政客的公开社交媒体信息。数据涵盖政客的文本内容、用户信息、互动记录等关键要素,为研究德国政客的党派归属及其相关特征提供了可靠的数据支持。...
    packageimg
  • Sciphi中小学至研究生教材样本数据集-thedevastator

    2025年6月4日   

    Sciphi中小学至研究生教材样本数据集-thedevastator 数据来源:互联网公开数据 标签:教材样本,教育研究,机器学习,数据集,开放源代码,文本分类,自然语言处理 数据概述:...
    packageimg
  • 社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证

    2025年6月1日   

    社交媒体仇恨言论检测多模态数据集-图文内容-测试与验证 数据来源:互联网公开数据 标签:仇恨言论,社交媒体,图像识别,文本分析,多模态学习,深度学习,图像分类,文本分类,自然语言处理,机器学习,人工智能,内容审核 数据概述:...
    packageimg
  • arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr

    2025年6月1日   

    arXiv学术论文多标签分类数据集-计算机科学-人工智能等领域-v2-kelixirr 数据来源:互联网公开数据 标签:学术论文,arXiv,多标签分类,文本分类,机器学习,计算机科学,人工智能,自然语言处理,数据集 数据概述:...
    packageimg
  • 雅虎问答10类别NLP数据集

    2025年6月1日   

    雅虎问答10类别NLP数据集 数据来源:互联网公开数据 标签:问答分类,自然语言处理,NLP,文本分类,问答系统,文本分析,机器学习,主题分类 数据概述:...
    packageimg
  • Reddit社区百万笑话文本数据集-thedevastator

    2025年6月1日   

    Reddit社区百万笑话文本数据集-thedevastator 数据来源:互联网公开数据 标签:笑话,幽默,Reddit,文本数据,自然语言处理,机器学习,情感分析,内容生成,笑话生成,文本分类 数据概述:...
    packageimg
  • 亚马逊商品评论情感二元分类数据集-商品评论-2019

    2025年6月1日   

    亚马逊商品评论情感二元分类数据集-商品评论-2019 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本分类,自然语言处理,机器学习,情感极性,负面评价,正面评价 数据概述:...
    packageimg
  • 亚马逊商品评论情感分析数据集-用户评价-大规模数据集

    2025年6月1日   

    亚马逊商品评论情感分析数据集-用户评价-大规模数据集 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,用户评价,文本分类,机器学习,自然语言处理,情感极性 数据概述:...
    packageimg
  • 维基百科推广文章数据集

    2025年6月1日   

    维基百科推广文章数据集 数据来源:互联网公开数据 标签:推广文章,维基百科,文本分类,内容分析,数据挖掘,信息质量,自然语言处理 数据概述: 本数据集包含两类文章:一类是被用户标记为“具有推广性语气”的文章(promotional.csv),另一类是被评估为“优质文章”的文章(good.csv)。 - 每篇推广性文章可能带有多个标签,包括但不限于: -...
    packageimg
  • 人工智能与人类文本区分数据集

    2025年6月1日   

    人工智能与人类文本区分数据集 数据来源:互联网公开数据 标签:人工智能,文本分类,文本转换,自然语言处理,NLP,数据分类,文本生成,文本质量评估 数据概述:...
    packageimg
  • 亚马逊商品评论情感分析数据集-用户评论-2018

    2025年5月31日   

    亚马逊商品评论情感分析数据集-用户评论-2018 数据来源:互联网公开数据 标签:亚马逊,商品评论,情感分析,文本分类,用户反馈,机器学习,自然语言处理,评论数据 数据概述:...
    packageimg
  • 组合评论语料库数据集

    2025年5月31日   

    组合评论语料库数据集 数据来源:互联网公开数据 标签:毒性评论,语言偏见,多语言分析,文本分类,自然语言处理,社会媒体,情感分析 数据概述: 本数据集整合了过去三年内的评论数据,涵盖了来自多个公开数据集的内容。数据集主要来源于三个关键的比赛任务: 1. 毒性评论分类挑战(Toxic Comment Classification...
    packageimg
  • 阿拉伯语新闻综合数据集-2021-ahmeddulaimi

    2025年5月31日   

    阿拉伯语新闻综合数据集-2021-ahmeddulaimi 数据来源:互联网公开数据 标签:阿拉伯语,新闻,文本分类,自然语言处理,文化,经济,体育,政治,艺术,社会,科技,医疗,宗教 数据概述:...
    packageimg
  • Reddit自帖子分类数据集-2011

    2025年5月31日   

    Reddit自帖子分类数据集-2011 数据来源:互联网公开数据 标签:Reddit,自帖子,文本分类,机器学习,多标签分类,社交网络,数据科学 数据概述:...
    packageimg
  • Fibe黑客挑战赛新闻文章分类数据集-2021

    2025年5月31日   

    Fibe黑客挑战赛新闻文章分类数据集-2021 数据来源:互联网公开数据 标签:AI挑战赛,新闻文章,文本分类,机器学习,数据处理,深度学习,分类模型 数据概述: 本数据集来源于Fibe举办的“Hack the Vibe! 2.0”...
    packageimg
  • 亚马逊客户评论情感极性数据集

    2025年5月31日   

    亚马逊客户评论情感极性数据集 数据来源:互联网公开数据 标签:情感分析,文本分类,亚马逊评论,自然语言处理,用户反馈,评分预测 数据概述:...
    packageimg