找到11,849个数据集

标签: 自然语言处理

过滤结果
  • 土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11

    2025年4月24日   

    土耳其邮件垃圾邮件数据集TurkishMailSpamDataset-alpersah11 数据来源:互联网公开数据 标签:垃圾邮件,电子邮件,文本分析,自然语言处理,机器学习,土耳其语,文本分类,网络安全 数据概述: 该数据集包含了土耳其语的电子邮件数据,用于垃圾邮件检测和分类。主要特征如下:...
    packageimg
  • 巴西费尔南多大学电力工程课程评论数据集UnifenasPLNCourseReviewsDataset-joaopedromorais1989

    2025年4月24日   

    巴西费尔南多大学电力工程课程评论数据集UnifenasPLNCourseReviewsDataset-joaopedromorais1989 数据来源:互联网公开数据 标签:课程评价,文本分析,情感分析,自然语言处理,教育,巴西,大学,机器学习 数据概述:...
    packageimg
  • 产品情感分析数据集-mustang007

    2025年4月24日   

    产品情感分析数据集-mustang007 数据来源:互联网公开数据 标签:情感分析,产品评论,自然语言处理,文本挖掘,机器学习,用户反馈,情感分类,意见挖掘 数据概述:该数据集包含来自各种来源的产品评论数据,记录了用户对不同产品的评价。主要特征如下: 时间跨度:数据记录的时间范围未明确,但包含了近期用户评论。...
    packageimg
  • 孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom

    2025年4月24日   

    孟加拉语句子转换数据集BanglaSentenceTransformationDataset-prinom 数据来源:互联网公开数据 标签:孟加拉语,自然语言处理,句子转换,数据集,文本生成,语言学,机器翻译,文本分析 数据概述: 该数据集包含孟加拉语的句子转换数据,记录了孟加拉语句子在不同语法结构和表达方式下的多种转换形式。主要特征如下:...
    packageimg
  • 推特仇恨言论情感分析数据集-fawadawan

    2025年4月24日   

    推特仇恨言论情感分析数据集-fawadawan 数据来源:互联网公开数据 标签:推特,仇恨言论,情感分析,自然语言处理,机器学习,文本分类,社交媒体,负面情绪 数据概述: 该数据集包含来自推特平台的数据,记录了推文内容及相应的情感标签,主要用于仇恨言论的情感分析研究。主要特征如下: 时间跨度: 数据记录的时间范围未明确标注,但推文数据通常具有时效性。...
    packageimg
  • 地区报纸可视化元数据数据集-nikhilwani

    2025年4月24日   

    地区报纸可视化元数据数据集-nikhilwani 数据来源:互联网公开数据 标签:新闻,可视化,数据集,文本分析,自然语言处理,信息检索,媒体研究,出版物 数据概述: 该数据集包含来自地区报纸的可视化元数据,记录了报纸文章中可视元素的详细信息。主要特征如下: 时间跨度:数据记录的时间范围为未知,具体时间跨度取决于数据集的原始来源。...
    packageimg
  • 科学BERT数据集SciBERTDataset-cse006kongkanbora

    2025年4月24日   

    科学BERT数据集SciBERTDataset-cse006kongkanbora 数据来源:互联网公开数据 标签:科学文献,自然语言处理,数据集,机器学习,深度学习,文本分类,学术研究,信息检索 数据概述:该数据集包含来自多个科学文献的数据,记录了大量科学论文的摘要,文本和相关元数据。主要特征如下:...
    packageimg
  • 综合评论数据集CombinedReviewsDataset-leonbec

    2025年4月24日   

    综合评论数据集CombinedReviewsDataset-leonbec 数据来源:互联网公开数据 标签:评论分析,数据集,自然语言处理,情感分析,机器学习,文本挖掘,商业智能,用户反馈 数据概述: 该数据集包含来自多个来源的用户评论数据,记录了用户对不同产品或服务的评价和反馈。主要特征如下: 时间跨度:数据记录的时间范围从2010年到2022年。...
    packageimg
  • 问答社区交通法规数据集Q-ATrafficLawDataset-chngnguynminhhong

    2025年4月24日   

    问答社区交通法规数据集Q-ATrafficLawDataset-chngnguynminhhong 数据来源:互联网公开数据 标签:交通法规,问答社区,数据集,法律,自然语言处理,文本分析,机器学习,法规解读 数据概述: 该数据集包含来自问答社区的交通法规相关问答数据,记录了用户提出的关于交通法规的问题及其相应的解答。主要特征如下:...
    packageimg
  • 卡纳达语情感分析数据集-kishorsinnur

    2025年4月24日   

    卡纳达语情感分析数据集-kishorsinnur 数据来源:互联网公开数据 标签:情感分析,卡纳达语,自然语言处理,数据集,文本分类,机器学习,印度语言,语言学 数据概述:该数据集包含来自各种来源的卡纳达语文本数据,用于情感分析任务。主要特征如下: 时间跨度:数据记录的时间范围不明确,但包含了从近期到过去一段时间的文本数据。...
    packageimg
  • 社交媒体评论真实标签数据集2015-2020数据集-trinhnguyenthmai

    2025年4月24日   

    社交媒体评论真实标签数据集2015-2020数据集-trinhnguyenthmai 数据来源:互联网公开数据 标签:社交媒体,评论,真实标签,数据分析,情感分析,自然语言处理,机器学习,互联网研究 数据概述: 该数据集包含来自社交媒体平台的评论数据,并标注了每条评论的真实情感标签。主要特征如下: 时间跨度:数据记录的时间范围从2015年到2020年。...
    packageimg
  • 推特情感分析数据集TweetSentimentAnalysisDataset-jiemingyou

    2025年4月24日   

    推特情感分析数据集TweetSentimentAnalysisDataset-jiemingyou 数据来源:互联网公开数据 标签:推特,情感分析,数据集,自然语言处理,机器学习,文本分类,社交媒体分析,社会学研究 数据概述: 该数据集包含来自推特的文本数据,记录了推文及其对应的情感标签,适用于情感分析,自然语言处理等任务。主要特征如下:...
    packageimg
  • 小型英语文本转换数据集ETT-smallDataset-neptureillusion

    2025年4月24日   

    小型英语文本转换数据集ETT-smallDataset-neptureillusion 数据来源:互联网公开数据 标签:文本处理,时间序列,机器学习,自然语言处理,英语,数据集,文本分析,预测 数据概述: 该数据集包含小型英语文本数据,专注于文本转换和预测任务。主要特征如下: 时间跨度: 数据记录的时间范围为特定时间段,具体取决于数据集的构建方式。...
    packageimg
  • Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl

    2025年4月24日   

    Quora问题重复检测预处理数据集QuoraQuestionDuplicationPreprocessingDataset-khaiurl 数据来源:互联网公开数据 标签:自然语言处理,数据集,文本分析,机器学习,分类任务,问答系统,重复检测,文本预处理 数据概述:...
    packageimg
  • 编程竞赛无引导数据集LeetCodeUnpromptedDataset-joshuajacobs2

    2025年4月24日   

    编程竞赛无引导数据集LeetCodeUnpromptedDataset-joshuajacobs2 数据来源:互联网公开数据 标签:编程竞赛,代码预测,数据集,机器学习,自然语言处理,软件工程,编程学习,算法研究 数据概述:该数据集包含来自LeetCode平台的编程竞赛代码数据,记录了参赛者提交的无引导代码。主要特征如下:...
    packageimg
  • 诗歌韵律预测数据集PoemMeterPredictionDataset-mhami2022

    2025年4月24日   

    诗歌韵律预测数据集PoemMeterPredictionDataset-mhami2022 数据来源:互联网公开数据 标签:诗歌分析,韵律预测,数据集,自然语言处理,机器学习,文本分析,文学研究,语言模型 数据概述: 该数据集包含来自公开诗歌数据库的诗歌作品,记录了诗歌的文本内容和对应的韵律信息。主要特征如下:...
    packageimg
  • 泰米尔语开放域问答数据集TamilOdqaDataset-aswin037

    2025年4月24日   

    泰米尔语开放域问答数据集TamilOdqaDataset-aswin037 数据来源:互联网公开数据 标签:泰米尔语,开放域问答,数据集,自然语言处理,机器学习,文本理解,问答系统,多语言 数据概述: 该数据集包含来自泰米尔语的开放域问答数据,记录了泰米尔语文本及其对应的问答对。主要特征如下:...
    packageimg
  • 印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa

    2025年4月24日   

    印地-英语情感分析数据集HinglishSentimentDataset-ankitlakraa 数据来源:互联网公开数据 标签:情感分析,数据集,自然语言处理,机器学习,文本挖掘,社交网络,多语言处理,印度市场 数据概述:该数据集包含来自社交媒体平台的印地-英语(Hinglish)文本数据,记录了用户对各种话题的情感表达。主要特征如下:...
    packageimg
  • 帕特尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren

    2025年4月24日   

    帕特尔洛克IMDB评论数据集PaatalLokIMDBReviewDataset-souren 数据来源:互联网公开数据 标签:电影评论,IMDB,数据集,自然语言处理,情感分析,文本挖掘,机器学习,数据科学 数据概述: 该数据集包含来自IMDB(互联网电影数据库)的帕特尔洛克(Paatal...
    packageimg
  • 语音数据记录与分析数据集VoiceCSVDataset-samarthbhalerao

    2025年4月24日   

    语音数据记录与分析数据集VoiceCSVDataset-samarthbhalerao 数据来源:互联网公开数据 标签:语音识别,数据集,音频处理,机器学习,自然语言处理,数据分析,人工智能,通信技术 数据概述: 该数据集包含来自互联网公开来源的语音记录数据,记录了不同场景下的语音信息。主要特征如下:...
    packageimg