数据集 - 海数据

自然语言处理灾难推文数据集NLPwithDisasterTweetsDataset-dillipmeher

2025年4月25日

自然语言处理灾难推文数据集NLPwithDisasterTweetsDataset-dillipmeher 数据来源：互联网公开数据标签：自然语言处理，灾难推文，数据集，文本分类，机器学习，推特，情感分析，危机管理数据概述：该数据集包含来自推特（Twitter）的推文数据，主要用于自然语言处理和文本分析任务，特别是与灾难相关的推文。主要特征如下：...

ZIP

罗马新闻文本数据集News-RomanDataset-zeshanali

2025年4月25日

罗马新闻文本数据集News-RomanDataset-zeshanali 数据来源：互联网公开数据标签：新闻文本，自然语言处理，文本分析，情感分析，信息检索，文本分类，机器学习，意大利语数据概述：该数据集包含来自罗马地区新闻网站的文本数据，记录了各类新闻文章的内容。主要特征如下：时间跨度：数据记录的时间范围从2010年到2020年。...

ZIP

波斯语数据集PersianDataset-amirali10281

2025年4月25日

波斯语数据集PersianDataset-amirali10281 数据来源：互联网公开数据标签：波斯语，语言学，自然语言处理，数据集，文本分析，机器翻译，文本分类，语音识别数据概述：该数据集包含波斯语文本和相关数据，旨在为波斯语语言处理研究提供支持。主要特征如下：时间跨度：数据记录的时间跨度不固定，涵盖了不同时期和类型的波斯语文本。...

ZIP

虚假新闻检测数据集DetectingFakeNewsDataset-mohsinchaudhary

2025年4月25日

虚假新闻检测数据集DetectingFakeNewsDataset-mohsinchaudhary 数据来源：互联网公开数据标签：新闻分析，虚假信息，数据集，机器学习，自然语言处理，文本分类，信息传播，社会研究数据概述：该数据集包含来自多个新闻来源的文本数据，记录了真实新闻和虚假新闻的文本内容及其相关信息。主要特征如下：...

ZIP

新闻CSV数据集

2025年4月25日

新闻CSV数据集数据来源：互联网公开数据标签：新闻,CSV,文本分类,数据分析,信息处理,新闻标题,新闻正文,主题标签数据概述：...

ZIP

泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit

2025年4月25日

泰米尔语新闻分类数据集TamilNewsCategoryDataset-vigneshvit 数据来源：互联网公开数据标签：新闻分类，泰米尔语，数据集，自然语言处理，文本分析，机器学习，信息检索，语言技术数据概述：该数据集包含来自泰米尔语新闻媒体的数据，记录了不同类别的泰米尔语新闻文章。主要特征如下：...

ZIP

数据2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset...

2025年4月25日

2015年爱数据科学挑战赛EDSA2015推特情感分类数据集EDSA2015TwitterSentimentClassificationDataset-jeanswiegers 数据来源：互联网公开数据标签：情感分析，社交媒体，数据集，文本分类，机器学习，自然语言处理，情感识别，数据挖掘数据概述：该数据集源自2015年爱数据科学挑战赛（EDSA...

ZIP

印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007

2025年4月25日

印地语情感分析数据集HindiLanguageSentimentAnalysisDataset-maheshmj007 数据来源：互联网公开数据标签：情感分析，自然语言处理，印地语，数据集，文本分类，机器学习，语言技术，数据分析数据概述：...

ZIP

情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli

2025年4月25日

情感分析预处理数据集GoEmotionsPreprocessedDataset-smritimadangarli 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，文本分类，机器学习，情感识别，深度学习，社交媒体数据概述：该数据集包含预处理后的GoEmotions数据集，用于情感分析任务。主要特征如下：...

ZIP

垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems

2025年4月25日

垃圾邮件检测训练数据集SpamTrainDataset-maureenekwems 数据来源：互联网公开数据标签：垃圾邮件，数据集，机器学习，文本分类，自然语言处理，电子邮件，数据分析，信息安全数据概述：该数据集包含用于垃圾邮件检测的训练数据，记录了电子邮件的分类标签和内容信息。主要特征如下：...

ZIP

自然语言处理项目数据集NLPProjectDataset-nikunjphutela

2025年4月25日

自然语言处理项目数据集NLPProjectDataset-nikunjphutela 数据来源：互联网公开数据标签：自然语言处理，文本分析，机器学习，深度学习，语言模型，数据集，文本分类，情感分析数据概述：该数据集为自然语言处理项目专用，记录了多种文本数据及相关标注信息。主要特征如下：时间跨度：数据记录的时间范围从2010年到2023年。...

ZIP

阿拉伯语文本情感分析数据集-akshat18

2025年4月25日

阿拉伯语文本情感分析数据集-akshat18 数据来源：互联网公开数据标签：自然语言处理，情感分析，阿拉伯语，文本数据，机器学习，语言学，舆情分析，文本分类数据概述：该数据集包含了大量的阿拉伯语文本，并标注了相应的情感极性。主要特征如下：时间跨度：数据未明确时间跨度，但数据内容反映了当前社会和文化背景。地理范围：...

ZIP

超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan

2025年4月25日

超大规模预训练语言模型数据集HS-XLNetDataset-gayatriilan 数据来源：互联网公开数据标签：自然语言处理，预训练模型，机器学习，深度学习，文本分类，语言模型，人工智能，数据集数据概述：该数据集包含来自超大规模预训练语言模型 HS-XLNet 的数据，记录了大规模文本语料的预训练过程和结果。主要特征如下：...

ZIP

情感分析数据集SentimentAnalysisDataset-jauharazka

2025年4月25日

情感分析数据集SentimentAnalysisDataset-jauharazka 数据来源：互联网公开数据标签：情感分析，数据集，自然语言处理，文本分类，机器学习，情感挖掘，数据挖掘，人工智能数据概述：该数据集包含来自公开来源的文本数据，记录了不同场景下的文本及其对应的情感标签。主要特征如下：...

ZIP

性别识别数据集GenderIdentificationDataset-srimadhumithak

2025年4月25日

性别识别数据集GenderIdentificationDataset-srimadhumithak 数据来源：互联网公开数据标签：性别识别，数据集，机器学习，自然语言处理，社会研究，数据分析，人工智能，文本分类数据概述：该数据集包含来自互联网的公开数据，记录了用于性别识别的文本数据。主要特征如下：...

ZIP

阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi

2025年4月25日

阿拉伯语情感分析数据集SentimentAnalysisinArabicDataset-essasartawi 数据来源：互联网公开数据标签：情感分析，阿拉伯语，数据集，自然语言处理，文本分类，机器学习，语言处理，情感计算数据概述：该数据集包含来自阿拉伯语社交媒体平台和评论网站的情感分析数据，记录了用户对特定主题或产品的情感表达。主要特征如下：...

ZIP

简历文本分类数据集ResumeTextClassificationDataset-blackitten13

2025年4月25日

简历文本分类数据集ResumeTextClassificationDataset-blackitten13 数据来源：互联网公开数据标签：自然语言处理，文本分类，数据集，简历分析，机器学习，招聘，人力资源，职业发展数据概述：该数据集包含来自公开的简历文本数据，记录了不同行业和职位的个人简历信息。主要特征如下：...

ZIP

达里贾语开放数据集DarijaOpenDataset-youneselbouknify

2025年4月25日

达里贾语开放数据集DarijaOpenDataset-youneselbouknify 数据来源：互联网公开数据标签：达里贾语，语言数据，自然语言处理，数据集，语料库，人工智能，机器学习，语言学数据概述：该数据集包含来自不同来源的达里贾语（摩洛哥阿拉伯语方言）文本数据，记录了日常对话，新闻报道，社交媒体帖子等多种类型的文本内容。主要特征如下：...

ZIP

印地语推文情感分析数据集MarathiTweetsforTuningAllDataset-suramyajadhav

2025年4月25日

印地语推文情感分析数据集MarathiTweetsforTuningAllDataset-suramyajadhav 数据来源：互联网公开数据标签：印地语，推文，情感分析，自然语言处理，机器学习，文本挖掘，社交媒体，情感识别数据概述：该数据集包含了来自推特平台的印地语推文，旨在用于情感分析任务。主要特征如下：...