找到3,862个数据集

标签: 文本分类

过滤结果
  • 会议论文标题与会议信息数据集

    2025年4月14日   

    会议论文标题与会议信息数据集 数据来源:互联网公开数据 标签:会议论文,标题,会议信息,自然语言处理,文本分类,主题建模,出版趋势,计算机科学,工程学 数据概述: 本数据集包含各类会议论文的标题及其发表的会议信息,涵盖了计算机科学和工程学等多个领域的领先会议。数据集提供了每个论文的标题和发表会议的名称,有助于研究这些会议的研究重点、模式和话题多样性。...
    packageimg
  • 印地语-英语混合数据集

    2025年4月14日   

    印地语-英语混合数据集 数据来源:互联网公开数据 标签:印地语,英语,混合语言,评论数据,网络欺凌,文本分类,社会媒体分析 数据概述: 本数据集包含超过9000条标注的印地语-英语混合语言(Hinglish)评论。每条评论都被标注为0或1,分别表示非欺凌评论和欺凌评论。数据集提供了丰富的多语言文本样本,适用于分析和研究网络环境中的欺凌行为。...
    packageimg
  • JavaPresse手动咖啡研磨机亚马逊用户评论情感分析数据集

    2025年4月14日   

    JavaPresse手动咖啡研磨机亚马逊用户评论情感分析数据集 数据来源:互联网公开数据 标签:咖啡研磨机,亚马逊,用户评论,情感分析,文本分类,产品评价,JavaPresse 数据概述:...
    packageimg
  • 快乐原因文本分类数据集

    2025年4月14日   

    快乐原因文本分类数据集 数据来源:互联网公开数据 标签:文本分类,情感分析,快乐原因,数据科学,机器学习,自然语言处理 数据概述: 本数据集来源于一次在HackerEarth上进行的数据科学家职位挑战赛,包含了一系列文本数据,每条文本表达了个体感到快乐的原因。数据集旨在通过文本分类技术,识别并归类出个体快乐的原因,从而为情感分析和用户行为研究提供支持。...
    packageimg
  • 句子完成度预测文本分类数据集

    2025年4月14日   

    句子完成度预测文本分类数据集 数据来源:互联网公开数据 标签:自然语言处理,句子完成度,文本分类,弱监督学习,新闻头条,文本数据清理 数据概述:...
    packageimg
  • 仇恨言论检测模型性能评估数据集

    2025年4月14日   

    仇恨言论检测模型性能评估数据集 数据来源:互联网公开数据 标签:仇恨言论检测, 自然语言处理, 模型评估, 文本分类, 机器学习, 偏见检测, 功能测试 数据概述: 本数据集“HateCheck”是一套用于评估仇恨言论检测模型性能的功能测试集。 数据集包含3728个经过验证的测试案例,涵盖了29种功能测试。...
    packageimg
  • YouTube评论情感分析数据集

    2025年4月14日   

    YouTube评论情感分析数据集 数据来源:互联网公开数据 标签:YouTube,评论,情感分析,自然语言处理,文本分类,情感标注,机器学习 数据概述:...
    packageimg
  • 斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集

    2025年4月14日   

    斯洛文尼亚网络文本类型识别数据集-GINCO1-0训练-测试集 数据来源:互联网公开数据 标签:文本分类,自然语言处理,语料库,斯洛文尼亚语,网络文本,文本类型识别,机器学习,GINCO 1.0,语料 数据概述: 本数据集是基于斯洛文尼亚网络文本类型识别语料库GINCO 1.0构建的训练集和测试集,按照80:20的比例划分。GINCO...
    packageimg
  • 推特讽刺分类数据集

    2025年4月14日   

    推特讽刺分类数据集 数据来源:互联网公开数据 标签:讽刺识别,自然语言处理,NLP,社交媒体分析,文本分类,讽刺检测,推特数据 数据概述: 本数据集包含了大量推特帖子,并被分类为讽刺性内容,并进一步细分为不同的讽刺子类别。该数据集为自然语言处理领域的学习者提供了宝贵的资源,可用于训练和测试模型。 数据用途概述:...
    packageimg
  • 英文新闻数据集

    2025年4月14日   

    英文新闻数据集 数据来源:互联网公开数据 标签:英文新闻,文本分类,机器学习,自然语言处理,数据预处理 数据概述: 本数据集包含5个类别,共1491条英文新闻记录。数据集涵盖多种新闻类型,提供了丰富的文本数据资源,适用于文本分类和自然语言处理等任务。 数据用途概述:...
    packageimg
  • 问题分类数据集

    2025年4月14日   

    问题分类数据集 数据来源:互联网公开数据 标签:问题分类,问答系统,自然语言处理,文本分类,信息抽取,机器学习,数据标注 数据概述:...
    packageimg
  • 文本分类器数据集

    2025年4月14日   

    文本分类器数据集 数据来源:互联网公开数据 标签:文本分类,语音转录,动作识别,对象识别,位置识别,机器学习,自然语言处理,数据标注 数据概述: 本数据集包含了从音频文件中提取的文本转录内容,记录了描述某一动作或过程的文字信息。数据集旨在提供用于识别动作、对象和位置的文本特征,支持训练相应的机器学习算法。 数据用途概述:...
    packageimg
  • 斯瓦希里语自然语言处理数据集

    2025年4月14日   

    斯瓦希里语自然语言处理数据集 数据来源:互联网公开数据 标签:斯瓦希里语,自然语言处理,网络内容检测,机器学习,深度学习,人工智能,文本分类,数据安全 数据概述:...
    packageimg
  • 希腊语COVID-19疫苗接种推文数据集

    2025年4月14日   

    希腊语COVID-19疫苗接种推文数据集 数据来源:互联网公开数据 标签:希腊语,COVID-19,疫苗接种,社交媒体分析,自然语言处理,文本分类,公共卫生,数据标注 数据概述: 本数据集包含2021年7月至8月期间收集的希腊语推文,内容聚焦于COVID-19疫苗接种相关话题。数据集中的推文经过人工标注,为研究希腊语社交媒体内容提供了高质量的文本资源。...
    packageimg
  • 原神游戏用户评论情感分析数据集

    2025年4月14日   

    原神游戏用户评论情感分析数据集 数据来源:互联网公开数据 标签:原神,游戏评论,情感分析,NLP,市场研究,用户反馈,文本分类,情绪检测 数据概述: 本数据集包含了从Google Play...
    packageimg
  • 写作者数据集

    2025年4月14日   

    写作者数据集 数据来源:互联网公开数据 标签:写作者,自然语言处理,文本分类,审计,多语言训练 数据概述: 本数据集包含从1963年至2021年间关于写作者的文本记录,文本主要以俄语撰写。数据集涵盖了各种类型的文档,包括但不限于文章、报告等,为自然语言处理和文本分类提供了丰富的训练素材。 数据用途概述:...
    packageimg
  • 格鲁吉亚语情感分析数据集

    2025年4月14日   

    格鲁吉亚语情感分析数据集 数据来源:互联网公开数据 标签:情感分析,格鲁吉亚语,自然语言处理,文本分类,社会研究 数据概述: 本数据集包含标注了情感标签的格鲁吉亚语句子,涵盖正面、负面和中性三种情感类型。数据集为研究格鲁吉亚语的情感表达和文本分析提供了丰富的语料资源。 数据用途概述:...
    packageimg
  • 汽车广告标题数据集

    2025年4月14日   

    汽车广告标题数据集 数据来源:互联网公开数据 标签:汽车广告,模型预测,文本分类,机器学习,NLP,数据预处理,广告分析 数据概述: 本数据集包含从伊朗主流在线市场Divar抓取的汽车广告标题,每个标题均标注了对应的汽车型号,为训练和评估汽车模型预测的机器学习模型提供了宝贵资源。数据集经过预处理,包括文本规范化和标点符号去除,确保数据的一致性和可用性。...
    packageimg
  • 古兰经文本数据集1963-2021

    2025年4月14日   

    古兰经文本数据集1963-2021 数据来源:互联网公开数据 标签:古兰经,伊斯兰教,自然语言处理,情感分析,文本分类,主题建模,语言生成,宗教文本,文化研究 数据概述:...
    packageimg
  • 互联网公开简历数据集分析

    2025年4月8日   

    标题:互联网公开简历数据集分析 数据内容: 该数据集包含2484条记录,每条记录包括以下字段: - ID:唯一标识符,共有2484种不同值。 - Resume_str:简历文本内容,共有2482种不同值。 - Resume_html:简历HTML格式内容,共有2482种不同值。 - Category:简历分类,共有24种不同值。 数据来源:...
    packageimg