数据集 - 海数据

过滤推文数据集

2025年4月26日

过滤推文数据集数据来源：互联网公开数据标签：推文,社交媒体,文本分析,自然语言处理,情绪分析,用户行为,MBTI人格类型,文本分类数据概述：...

ZIP

周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas

2025年4月26日

周末黑客松第二版情感分析数据集WeekendHackathonEdition2SentimentDataset-tirthankardas 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，文本挖掘，机器学习，数据科学，情感识别，文本分类数据概述：...

ZIP

医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa

2025年4月26日

医学摘要文本分类数据集MedicalAbstractsTextClassificationCorpus-saharalaa 数据来源：互联网公开数据标签：医学，摘要，文本分类，自然语言处理，机器学习，医疗健康，语料库，医学文献数据概述：该数据集包含来自医学文献的摘要文本，用于文本分类任务。主要特征如下：...

ZIP

通用语言理解评估数据集GLUEDataset-ankitchettri

2025年4月26日

通用语言理解评估数据集GLUEDataset-ankitchettri 数据来源：互联网公开数据标签：自然语言处理，语言理解，数据集，机器学习，文本分类，语义分析，人工智能，深度学习数据概述：该数据集为通用语言理解评估（GLUE）项目提供的数据集，包含多种自然语言处理任务的数据，记录了不同语言理解任务的数据样本。主要特征如下：...

ZIP

讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298

2025年4月26日

讽刺与嘲讽文本数据集IronyandSarcasmTextDataset-bce1298 数据来源：互联网公开数据标签：讽刺，嘲讽，情感分析，自然语言处理，文本数据，机器学习，情感识别，语言学数据概述：该数据集包含了标注了讽刺和嘲讽情感的文本数据，旨在用于情感分析和自然语言处理任务。主要特征如下：...

ZIP

马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu

2025年4月26日

马拉地语新闻数据集MarathiNewsTFDataset-harshitjnu 数据来源：互联网公开数据标签：新闻，语言分析，数据集，自然语言处理，文本分类，机器学习，印度语言，数据挖掘数据概述：该数据集包含来自马拉地语新闻媒体的文章，记录了马拉地语新闻的文本内容。主要特征如下：时间跨度：数据记录的时间范围从2016年到2018年。...

ZIP

数据2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050

2025年4月26日

2014年acl会议反讽识别数据集ACL2014IronyRecognitionDataset-akshit3050 数据来源：互联网公开数据标签：自然语言处理，情感分析，数据集，反讽识别，机器学习，文本分类，语言学，情感计算数据概述：该数据集由2014年计算语言学协会（ACL）会议提供，专注于社交媒体文本中的反讽识别任务。主要特征如下：...

ZIP

文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn

2025年4月26日

文章主题分类数据集ArticleTopicsClassificationDataset-bchadburn 数据来源：互联网公开数据标签：文本分类，自然语言处理，数据集，机器学习，信息检索，文本分析，知识图谱，学术研究数据概述：该数据集包含来自多个来源的文章主题分类数据，记录了各类文章的主题标签和内容。主要特征如下：...

ZIP

短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad

2025年4月26日

短信垃圾邮件检测数据集SMSSpamDetectionDataset-raheebemad 数据来源：互联网公开数据标签：短信，垃圾邮件，数据集，自然语言处理，文本分类，机器学习，数据挖掘，信息安全数据概述：该数据集包含短信文本数据，用于垃圾短信检测。主要特征如下：时间跨度：数据记录的时间范围不明确，但涵盖了收集这些短信的时间段。...

ZIP

垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11

2025年4月26日

垃圾邮件检测数据集SpamMessageDetectionDataset-hakim11 数据来源：互联网公开数据标签：垃圾邮件，短信，自然语言处理，文本分类，机器学习，数据集，情感分析，信息安全数据概述：该数据集包含来自公开渠道的短信数据，主要用于垃圾邮件检测任务。主要特征如下：时间跨度：数据记录的时间范围不定，涵盖了收集数据的时期。...

ZIP

轻量级有毒评论数据集ToxicLiteDataset-justinluu

2025年4月26日

轻量级有毒评论数据集ToxicLiteDataset-justinluu 数据来源：互联网公开数据标签：文本分析，自然语言处理，情感分析，数据集，机器学习，有毒评论，社交媒体，文本分类数据概述：该数据集包含来自社交媒体平台（如Twitter，Reddit等）的评论数据，记录了评论的文本内容及其有毒性标签。主要特征如下：...

ZIP

自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta

2025年4月26日

自然语言处理NLP领域数据集one-nlpDataset-dogruzvelta 数据来源：互联网公开数据标签：自然语言处理，NLP，数据集，文本分析，机器学习，模型训练，语言模型，情感分析数据概述：该数据集包含来自NLP领域的多样化文本数据，旨在支持各种NLP任务，如文本分类，情感分析，机器翻译等。主要特征如下：...

ZIP

情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri

2025年4月26日

情感分析大模型BERT-base数据集EmotionAnalysisLargeModelBERT-baseDataset-ubbarapusiri 数据来源：互联网公开数据标签：情感分析，自然语言处理，数据集，BERT模型，机器学习，文本分类，深度学习，人工智能数据概述：该数据集专注于情感分析任务，基于BERT-...

ZIP

GermEval18文本分类数据集-thedevastator

2025年4月22日

GermEval18文本分类数据集-thedevastator 数据来源：互联网公开数据标签：文本分类,情感分析,主题分类,二元分类,多类分类,自然语言处理,机器学习数据概述：...

ZIP

泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad

2025年4月26日

泰迪问答系统多语言数据集BengaliandTeluguVersion数据集泰迪QABengali-TeluguDataset-nbroad 数据来源：互联网公开数据标签：泰迪QA，多语言问答，数据集，自然语言处理，机器学习，文本分类，语言理解，计算机辅助翻译数据概述：该数据集包含来自泰迪QA（TYDI...

ZIP

网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos

2025年4月26日

网络欺凌分类数据集CyberbullyingClassificationDataset-mos3santos 数据来源：互联网公开数据标签：网络欺凌，文本分类，自然语言处理，情感分析，社交媒体，机器学习，欺凌检测，文本数据数据概述：...

ZIP

虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi

2025年4月26日

虚假新闻识别数据集FakeandRealNewsDataset-fedwaalgamdi 数据来源：互联网公开数据标签：新闻，虚假新闻，真实新闻，自然语言处理，文本分类，机器学习，舆情分析，信息检索数据概述：该数据集包含了来自不同来源的虚假新闻和真实新闻数据，用于训练和评估虚假新闻检测模型。主要特征如下：...

ZIP

文本分类数据集TextClassificationDataset-quanghuyho06

2025年4月26日

文本分类数据集TextClassificationDataset-quanghuyho06 数据来源：互联网公开数据标签：文本分类，自然语言处理，数据集，机器学习，情感分析，主题建模，文本分析，人工智能数据概述：该数据集包含用于文本分类任务的多种文本数据，涵盖了不同领域和主题。主要特征如下：...

ZIP

虚假评论检测数据集FakeReviewDetectionDataset-uselessguy

2025年4月26日

虚假评论检测数据集FakeReviewDetectionDataset-uselessguy 数据来源：互联网公开数据标签：虚假评论，情感分析，自然语言处理，文本分类，机器学习，评论分析，欺诈检测，社交媒体数据概述：该数据集包含来自不同来源的评论数据，主要用于检测虚假评论。主要特征如下：时间跨度：...

ZIP

垃圾邮件过滤数据集-aymendernani

2025年4月26日

垃圾邮件过滤数据集-aymendernani 数据来源：互联网公开数据标签：垃圾邮件，文本分类，自然语言处理，机器学习，邮件过滤，数据集，信息检索，人工智能数据概述：该数据集包含来自不同来源的邮件数据，用于垃圾邮件过滤任务。主要特征如下：时间跨度：数据记录的时间范围不定，涵盖了不同时期的邮件数据。...

ZIP

找到4,369个数据集

注册成功！