找到11,864个数据集

标签: 自然语言处理

过滤结果
  • 埃隆-马斯克最新3000条推文数据集ElonMuskLast3000TweetsDataset-bhatta29

    2025年4月25日   

    埃隆-马斯克最新3000条推文数据集ElonMuskLast3000TweetsDataset-bhatta29 数据来源:互联网公开数据 标签:社交媒体,数据分析,机器学习,文本挖掘,情感分析,自然语言处理,趋势研究,公共人物 数据概述: 该数据集包含来自推特平台(Twitter)的公开数据,记录了埃隆·马斯克(Elon...
    packageimg
  • 灾难事件推文分析数据集DisasterTwitterCleanedDataset-kefahaied

    2025年4月25日   

    灾难事件推文分析数据集DisasterTwitterCleanedDataset-kefahaied 数据来源:互联网公开数据 标签:社交媒体,自然语言处理,数据集,灾害研究,情感分析,机器学习,舆情监测,应急响应 数据概述: 该数据集包含来自Twitter平台的清理后推文数据,记录了与各类灾难事件相关的文本信息。主要特征如下:...
    packageimg
  • 电影评论文本情感分类数据集IMDbSentimentClassificationDataset-notmyname16

    2025年4月25日   

    电影评论文本情感分类数据集IMDbSentimentClassificationDataset-notmyname16 数据来源:互联网公开数据 标签:情感分析,自然语言处理,数据集,文本分类,机器学习,影评,深度学习,人工智能 数据概述: 该数据集包含来自IMDb(互联网电影数据库)的电影评论文本,记录了用户对电影的评价及其情感倾向。主要特征如下:...
    packageimg
  • 旁遮普语电影生产评论数据集PunjabiTranslatedMovieProductionReviewsDataset-commandarrick

    2025年4月25日   

    旁遮普语电影生产评论数据集PunjabiTranslatedMovieProductionReviewsDataset-commandarrick 数据来源:互联网公开数据 标签:电影评论,旁遮普语,数据集,自然语言处理,文本分析,情感分析,机器学习,翻译研究 数据概述:...
    packageimg
  • StackExchange标签数据推荐系统数据集StackExchangeTagDataforRecommendationSystemDataset-gr...

    2025年4月25日   

    StackExchange标签数据推荐系统数据集StackExchangeTagDataforRecommendationSystemDataset-granjithkumar 数据来源:互联网公开数据 标签:推荐系统,数据集,机器学习,自然语言处理,标签预测,用户行为,社区分析,软件开发 数据概述: 该数据集包含来自Stack...
    packageimg
  • 可信赖性标注数据集CheckworthinessLabeledDataset-raghavvora

    2025年4月25日   

    可信赖性标注数据集CheckworthinessLabeledDataset-raghavvora 数据来源:互联网公开数据 标签:可信赖性,数据集,文本分析,机器学习,自然语言处理,信息验证,数据标注,舆论研究 数据概述:该数据集包含来自公开来源的文本数据,记录了不同文本内容的可信赖性标注信息。主要特征如下: 时间跨度:数据记录的时间范围未明确说明。...
    packageimg
  • Bootstrap100问题200题集语气变化数据集20240319-asalan

    2025年4月25日   

    Bootstrap100问题200题集语气变化数据集20240319-asalan 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,语气识别,机器学习,文本挖掘,语言学,数据分析 数据概述:该数据集包含来自Bootstrap项目的100个问题,每个问题有200个不同语气变化的题集记录,适用于语气识别和文本分析等任务。主要特征如下:...
    packageimg
  • 莫迪推特数据集AllNarendraModiTweetsDataset-reach2ashish

    2025年4月25日   

    莫迪推特数据集AllNarendraModiTweetsDataset-reach2ashish 数据来源:互联网公开数据 标签:推特,社交媒体,政治,数据集,印度,数据分析,自然语言处理,政治影响力 数据概述:该数据集包含来自印度总理莫迪(Narendra Modi)的推特数据,记录了其在推特平台上发布的信息。主要特征如下:...
    packageimg
  • 垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u

    2025年4月25日   

    垃圾邮件与正常邮件数据集Spam-HamEmailDataset-sarthak4u 数据来源:互联网公开数据 标签:垃圾邮件,正常邮件,电子邮件,文本分类,自然语言处理,机器学习,文本分析,信息检索 数据概述: 该数据集包含来自公开邮箱的垃圾邮件(Spam)和正常邮件(Ham)数据,用于训练和评估垃圾邮件检测模型。主要特征如下:...
    packageimg
  • 在线新闻流行度数据集OnlineNewsPopularityDataset-btphan

    2025年4月25日   

    在线新闻流行度数据集OnlineNewsPopularityDataset-btphan 数据来源:互联网公开数据 标签:在线新闻,流行度分析,数据集,机器学习,自然语言处理,媒体研究,信息传播,社会学 数据概述:该数据集包含来自葡萄牙新闻门户网站的兴趣新闻网站的在线新闻文章数据,记录了新闻文章的特征及其流行度指标。主要特征如下:...
    packageimg
  • 阿拉伯语拼写数据集SpellArabicDataset-twproject

    2025年4月25日   

    阿拉伯语拼写数据集SpellArabicDataset-twproject 数据来源:互联网公开数据 标签:阿拉伯语,拼写检查,数据集,自然语言处理,文本分析,机器学习,语言技术,语言学 数据概述:该数据集包含来自互联网的阿拉伯语文本数据,记录了阿拉伯语拼写错误及其正确拼写的对应关系。主要特征如下:...
    packageimg
  • 消息数据集MessageDataSet-smtkmr102

    2025年4月25日   

    消息数据集MessageDataSet-smtkmr102 数据来源:互联网公开数据 标签:消息,数据集,通信,自然语言处理,数据分析,社会网络,文本挖掘,信息处理 数据概述: 该数据集包含来自互联网公开消息平台的数据,记录了各类通信消息的详细信息。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 文章角度分析机器学习数据集NaufalMLSudutArtikelDataset-naufalainurrizal

    2025年4月25日   

    文章角度分析机器学习数据集NaufalMLSudutArtikelDataset-naufalainurrizal 数据来源:互联网公开数据 标签:机器学习,文章分析,数据集,自然语言处理,文本分类,情感分析,学术研究,计算机科学 数据概述: 该数据集包含来自Naufal项目的机器学习文章角度分析数据,记录了文章的角度和观点分类信息。主要特征如下:...
    packageimg
  • 印度金融新闻标题数据集2015-2023-iamdhruval

    2025年4月25日   

    印度金融新闻标题数据集2015-2023-iamdhruval 数据来源:互联网公开数据 标签:金融新闻,印度,文本分析,自然语言处理,新闻标题,情感分析,数据集,财经 数据概述: 该数据集包含了来自互联网的印度金融新闻标题,记录了印度金融领域的新闻头条信息。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2023年。...
    packageimg
  • BBC新闻数据集BBCNewsDataset-shineucc

    2025年4月25日   

    BBC新闻数据集BBCNewsDataset-shineucc 数据来源:互联网公开数据 标签:新闻,数据集,文本分析,自然语言处理,机器学习,媒体研究,情感分析,信息检索 数据概述:该数据集包含来自BBC新闻网站的新闻文章数据,记录了不同类别新闻文章的内容。主要特征如下: 时间跨度:数据记录的时间范围从2004年到2005年。...
    packageimg
  • 伊姆兰-汗推特数据集ImranKhanTweetsDataset-shankhl

    2025年4月25日   

    伊姆兰-汗推特数据集ImranKhanTweetsDataset-shankhl 数据来源:互联网公开数据 标签:推特数据,社交媒体,政治,人物,文本分析,自然语言处理,舆情分析,巴基斯坦 数据概述: 该数据集包含了关于伊姆兰·汗在推特上的相关推文数据。主要特征如下: 时间跨度:数据记录的时间范围为特定时间段,具体起始和结束时间取决于数据集的创建时间。...
    packageimg
  • Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr

    2025年4月25日   

    Udemy付费课程信息数据集UdemyPaidCoursesDataset-abhayjr 数据来源:互联网公开数据 标签:在线教育,数据集,课程信息,机器学习,自然语言处理,文本分析,数据挖掘,教育科技 数据概述: 该数据集包含了Udemy平台上付费课程的详细信息,旨在为研究人员和数据分析师提供关于在线教育领域的全面数据。主要特征如下:...
    packageimg
  • 卫星图像描述生成数据集SatelliteImageCaptionGenerationDataset-mits2249691

    2025年4月25日   

    卫星图像描述生成数据集SatelliteImageCaptionGenerationDataset-mits2249691 数据来源:互联网公开数据 标签:卫星图像,图像描述,自然语言处理,深度学习,计算机视觉,图像生成,数据集,人工智能 数据概述: 该数据集包含卫星图像及其对应的文本描述,用于训练和评估卫星图像描述生成模型。主要特征如下:...
    packageimg
  • Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc

    2025年4月25日   

    Squad2020问答数据集SQuAD2020QuestionAnsweringDataset-parthplc 数据来源: 互联网公开数据 标签: 问答系统,自然语言处理,数据集,机器学习,文本分析,语义理解,深度学习,人工智能 数据概述: 该数据集源自斯坦福大学的 SQuAD 2020 项目,专注于问答系统的训练和评估。主要特征如下:...
    packageimg
  • 印尼推特情绪分析数据集IndonesianTwitterSentimentAnalysisDataset-deaclaresta

    2025年4月25日   

    印尼推特情绪分析数据集IndonesianTwitterSentimentAnalysisDataset-deaclaresta 数据来源:互联网公开数据 标签:社交媒体,情感分析,数据集,机器学习,文本挖掘,自然语言处理,印尼语,情绪识别 数据概述: 该数据集包含来自印尼推特用户的数据,记录了用户发布的推文及其对应的情感标签。主要特征如下:...
    packageimg