找到3,865个数据集

标签: 文本分类

过滤结果
  • 英国广播公司新闻文本数据集BBCNewsTextDataset-avishi

    2025年4月23日   

    英国广播公司新闻文本数据集BBCNewsTextDataset-avishi 数据来源:互联网公开数据 标签:新闻,文本,数据集,自然语言处理,文本分类,机器学习,新闻报道,舆情分析 数据概述: 该数据集包含来自英国广播公司(BBC)的新闻文章文本数据,用于文本分类和自然语言处理任务。主要特征如下:...
    packageimg
  • 虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222

    2025年4月23日   

    虚假新闻检测与预测数据集FakeNewsPredictDataDataset-rahulgupta1222 数据来源:互联网公开数据 标签:新闻分析,数据集,虚假信息检测,机器学习,文本分类,自然语言处理,信息安全,社会研究 数据概述: 该数据集包含来自互联网的真实新闻与虚假新闻数据,记录了新闻文本及相关特征,用于虚假新闻的识别与预测。主要特征如下:...
    packageimg
  • 假新闻检测数据集DetectFakeNewsDataset-sanamps

    2025年4月23日   

    假新闻检测数据集DetectFakeNewsDataset-sanamps 数据来源:互联网公开数据 标签:假新闻,数据集,新闻分析,机器学习,文本分类,信息鉴别,社交媒体,社会研究 数据概述:该数据集包含来自多个来源的新闻文章数据,记录了真实新闻和假新闻的样本。主要特征如下: 时间跨度:数据记录的时间范围从2017年到2023年。...
    packageimg
  • 泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420

    2025年4月23日   

    泰米尔语NLP任务训练数据集TamilNLPTaskTrainingDataset-rohit7420 数据来源:互联网公开数据 标签:自然语言处理,泰米尔语,文本分类,机器翻译,情感分析,数据集,语言学,机器学习 数据概述: 该数据集包含用于泰米尔语自然语言处理(NLP)任务的训练数据。主要特征如下: 时间跨度:...
    packageimg
  • 负面评论数据集NegativeCommentsDataset-yuzhe2020

    2025年4月23日   

    负面评论数据集NegativeCommentsDataset-yuzhe2020 数据来源:互联网公开数据 标签:文本分析,情感分析,数据集,自然语言处理,机器学习,数据挖掘,情感识别,文本分类 数据概述: 该数据集包含来自互联网的负面评论数据,记录了用户在社交媒体,电商平台等平台上的负面评价信息。主要特征如下:...
    packageimg
  • 问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat

    2025年4月23日   

    问题陈述命令分类数据集QuestionStatementCommandClassificationsDataset-kiranbhagat 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,命令识别,问题分析,语言模型,智能问答 数据概述:...
    packageimg
  • 垃圾短信检测数据集SMSSpamDataset-hanzvivatma

    2025年4月23日   

    垃圾短信检测数据集SMSSpamDataset-hanzvivatma 数据来源:互联网公开数据 标签:文本分类,垃圾短信,自然语言处理,机器学习,数据集,短信,NLP,文本分析 数据概述: 该数据集包含了大量短信文本数据,用于垃圾短信的检测与识别。主要特征如下: 时间跨度: 数据记录的时间范围不明确,但涵盖了短信内容在一定时间内的收集。 地理范围:...
    packageimg
  • 灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3

    2025年4月23日   

    灾害应急处理自然语言处理数据集NLPwithDisasterDataset-tarun2k3 数据来源:互联网公开数据 标签:自然语言处理,灾害应急,文本分类,数据集,机器学习,信息检索,危机管理,社会媒体分析 数据概述:该数据集包含来自Twitter的推文数据,记录了与灾害事件相关的文本信息。主要特征如下:...
    packageimg
  • 有毒评论测试数据集-husanrahmatullayev

    2025年4月23日   

    有毒评论测试数据集-husanrahmatullayev 数据来源:互联网公开数据 标签:文本分析,自然语言处理,数据集,情感分析,有毒内容,机器学习,评论数据,文本分类 数据概述: 该数据集包含用于测试有毒评论检测模型的文本数据,记录了各种类型的在线评论,并标注了其毒性。主要特征如下:...
    packageimg
  • 越南语文本分类数据集-trnthinph

    2025年4月23日   

    越南语文本分类数据集-trnthinph 数据来源:互联网公开数据 标签:越南语,文本分类,自然语言处理,数据集,情感分析,语言学,机器学习,文本挖掘 数据概述: 该数据集包含越南语文本数据,并按照不同的类别进行标注。主要特征如下: 时间跨度:数据记录的时间范围无明确限制,取决于文本的发布时间。...
    packageimg
  • 阿姆哈拉语新闻文本分类数据集

    2025年4月23日   

    阿姆哈拉语新闻文本分类数据集 数据来源:互联网公开数据 标签:阿姆哈拉语,新闻分类,文本分类,自然语言处理,机器学习, Ethiopic script,基准性能 数据概述:...
    packageimg
  • 垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha

    2025年4月23日   

    垃圾邮件检测与情感分析数据集EmailSpamDetectionandSentimentAnalysisDataset-adarshkumarjha 数据来源:互联网公开数据 标签:垃圾邮件,情感分析,数据集,文本分类,自然语言处理,机器学习,文本挖掘,信息检索 数据概述: 该数据集包含了电子邮件数据,用于垃圾邮件检测和情感分析任务。主要特征如下:...
    packageimg
  • 有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain

    2025年4月23日   

    有毒评论分类德语数据集JigsawToxicCommentClassificationGermanDataset-shubheshswain 数据来源:互联网公开数据 标签:自然语言处理,文本分类,数据集,机器学习,情感分析,网络安全,德语,仇恨言论 数据概述: 该数据集由Jigsaw竞赛提供,包含德语评论数据,用于有毒评论的识别和分类。主要特征如下:...
    packageimg
  • 以色列与哈马斯冲突新闻报道纽约时报数据集2024年-2024年6月26日-dalaiaguirre

    2025年4月23日   

    以色列与哈马斯冲突新闻报道纽约时报数据集2024年-2024年6月26日-dalaiaguirre 数据来源:互联网公开数据 标签:以色列,哈马斯,战争,新闻报道,New York Times,NYT,NLP,文本分类,情感分析,命名实体识别 数据概述:...
    packageimg
  • 网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod

    2025年4月23日   

    网络仇恨言论识别数据集HateSpeechRecoDataset-shinnurathod 数据来源:互联网公开数据 标签:仇恨言论,数据集,情感分析,自然语言处理,机器学习,社交媒体,文本分类,网络安全 数据概述: 该数据集包含来自社交媒体平台和网络论坛的文本数据,记录了用户发布的内容及其标签,用于识别和分类仇恨言论。主要特征如下:...
    packageimg
  • BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad

    2025年4月23日   

    BERT模型处理结果数据集BERTModelProcessingResultsDataset-altegrad 数据来源:互联网公开数据 标签:自然语言处理,机器学习,数据集,文本分析,深度学习,语言模型,AI研究,文本分类 数据概述:该数据集包含通过BERT模型处理后的文本数据结果,记录了BERT模型对输入文本的分析和处理输出。主要特征如下:...
    packageimg
  • 网页链接与描述数据集-fan1dy

    2025年4月23日   

    网页链接与描述数据集-fan1dy 数据来源:互联网公开数据 标签:网页链接,文本分析,数据挖掘,自然语言处理,信息检索,文本分类,网络数据,数据集 数据概述: 该数据集包含来自互联网的网页链接,网页标题和网页描述信息。主要特征如下: 时间跨度:数据记录的时间范围不明确,取决于抓取时间,但涵盖了大量的网页数据。 地理范围:数据覆盖全球范围内的网页。...
    packageimg
  • 自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar

    2025年4月23日   

    自然语言处理情感分析数据集NaturalLanguageProcessingSentimentAnalysisDataset-alihamadbakar 数据来源:互联网公开数据 标签:自然语言处理,情感分析,数据集,文本挖掘,机器学习,文本分类,人工智能,语言技术...
    packageimg
  • 在线欺凌文本数据集-agadaunogwu

    2025年4月23日   

    在线欺凌文本数据集-agadaunogwu 数据来源:互联网公开数据 标签:网络欺凌,文本数据,自然语言处理,情感分析,机器学习,社交媒体,文本分类,恶意言论 数据概述: 该数据集包含来自社交媒体平台的文本数据,记录了用户之间的在线欺凌行为。主要特征如下: 时间跨度:数据记录的时间范围为未知,但包含了近期社交媒体上的文本信息。...
    packageimg
  • 斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha

    2025年4月23日   

    斯坦福大型电影评论数据集StanfordLargeMovieReviewDataset-abirchodha 数据来源:互联网公开数据 标签:电影评论,情感分析,文本分类,自然语言处理,机器学习,数据集,情感识别,NLP 数据概述: 该数据集由斯坦福大学提供,包含了来自IMDb的电影评论数据,主要用于情感分析研究。主要特征如下:...
    packageimg